广告
又是真相,又是之谜,感觉这个标题很混沌,可能就像科大讯飞现在的处境一样,2018.9.17-9.19 《2018世界人工智能大会》,9.20紧接着的《2018创新与新兴产业发展国际会议(IEID)》,语音方面的AI,好好的一手牌,却打得稀巴烂。
在众多媒体口诛笔伐的情况下,科大讯飞哪怕已经做出了回应和澄清。我们来捋一捋这次同传事件的来龙去脉,然后探究其背后的真相,再找出这个真相的谜之处。
本文大纲:
1、 9.20知乎网友Bell Wang爆料科大讯飞“造假”
2、 人机耦合:9.21科大讯飞回应
3、 人机大战:9.21-9.24科大讯飞“造假”事件发酵
4、 9.25科大讯飞澄清
5、 9.25 Bell Wang的声音
6、 同传同行的声音
7、 真相之谜
8、 客观评价
9月21日晚间20点,科大讯飞官方对此事进行了专门回应,表示科大讯飞用的是人机耦合技术,认为是沟通不足造成的一场误会。
科大讯飞官方敷衍式的回应后,媒体铺天盖地进行了各种报道,事件深度发酵,本来是人机耦合技术,现在转变成人机大战,科大讯飞估计如坐针毡,如履薄冰,坐立不安。
官方主要澄清内容,主要如下::
1、科大讯飞从未“隐瞒”转写同传声音
2、科大讯飞不存在侵犯同声传译知识产权的可能性
3、科大讯飞技术既能转写也能翻译4、机器翻译明年将达英语专业八级水平,可以较好满足日常交流需要,但还无法代替同传
5、“人机耦合”不仅是技术发展的趋势,更是社会伦理发展的要求
6、我们将用法律武器维护公司声誉。
以下为官方回应全文:
2018 年 9 月 25 日
先看作者的总结:
我觉得科大讯飞的王玮女士展现出了诚意,沟通过程中一直友好理性。这次的解释是让我能够接受的,从我的角度看,可以认为讯飞没有主动造假的行为,但是讯飞的营销和公关存在比较大的问题,客观上放任了媒体的过分宣传,导致了各方的误会。
讯飞表示在以后的工作中需要更有前瞻性,在营销和公关的把控上必须严格,要在发现媒体过度宣传的时候就尽早进行澄清,并且在以后可能的技术呈现过程中充分做好标识,避免误会。
最后我们进行了更多交流,我提出建议,讯飞在未来与译员可能合作时,需要得到译员的知情同意,并签订协议,而且需要应用译员知识产权的翻译内容时,也需要得到许可,否则不可使用。讯飞承诺将尽快探索这一机制并执行。并且,这次事件激发了很多来自业界的讨论,我也提出希望讯飞能主动进行联系沟通进行澄清。
最后补充几句题外话:
本身我写前一篇文章的时候,考虑得也十分简单,就是感觉受到了不公的待遇,要将自己的经历写出来。而且当时多少情绪也比较激动,有些措辞比较激烈。结果后来自然也被解读了,还有人说我是“带着任务来的”。之后事情影响越来越大,各个媒体,甚至外媒都开始报道以及引用我的文章。不仅如此,业内的朋友们也开始在我身上寄托很多期望,希望维护合理的权利和诉求。这时我才意识到,发声一定要谨慎,即使我描述了事情的经过,但几句不谨慎的话还是会引起麻烦。于是我决定不再评论回复(看都不看了,免得心烦),也拒绝了所有媒体的采访请求。这里还是再说一遍,我从未委托任何人代替我发声,我自己说的也仅仅代表我自己,我也没有权力代表同传行业,我只能从自己的角度去聆听,并得出自己的结论。但这次我觉得最有价值的还是结尾的讨论。澄清事件解释误会都只是对过去的总结,关键还是在于事件能否对未来有积极的影响。如果这次事件真的能建立事先沟通机制,保护好译员的权利,规范化知识产权的使用,并且能让大家理性看待AI技术,不要不理性地拔高或贬低,那我觉得这次事件就不是一次闹剧,而是一次真正产生价值的事件。
我们回过来看看全文:
这篇文章因为是整理语音交流内容,可能会比较乱。如果有人觉得太长不愿意看,可以跳过中间直奔结论。
昨天,我得知科大讯飞想要和我进行沟通,将事情来龙去脉解释清楚并澄清一些误会。我觉得这样做确实会让事情清楚一些,比两边隔空喊话要高效很多,于是就答应了。
今天,我就与科大讯飞消费者事业群副总裁,听见科技总经理王玮女士进行了语音沟通。整个交流持续了大约一小时十分钟。我们双方都留了录音。
一开始我先解释了下在文章中我的一些激烈用词(囧),确实是情绪有些激动,比较不好意思,然后我就提出了在我文章中主要的几个问题。一个就是现场字幕的问题,事先我并没有得知有讯飞参与,也没有人征求我的同意,并且只有“讯飞听见”几个字还是很容易让观众误解为是讯飞提供的字幕翻译,也会让同传译员误解,感觉受到不尊重。二是直播的同传音轨使用tts语音合成而不是直接用同传译员的翻译音轨,同时知领的直播介绍中的文字说有“智能翻译”功能,对观众非常有误导性,有欺骗嫌疑。同时还提到了我后来想到的一点,就是讯飞作为这样一个大影响力的公司,是不是在营销和公关上控制不足,导致很多误会。
王女士先解释了第一点。讯飞听见之前也在几次比较有影响力的会议上有所使用,应该已经有不少人熟知,而这次的会议其实有很多的承办方,并且有会务公司和翻译公司的参与。王女士表示科大讯飞在多次的筹备会议中明确要求要通知到所有相关方会有讯飞听见的字幕技术应用和展示,是不是哪一环沟通出现了问题。这一点上,我倒确实后来听相关方说,跟我确定会议相对晚,据说其他译员老师被通知了,可能是因为我确定晚漏了我一个。那这点上我觉得这个解释可以接受,但遗留的问题就是,这种情况下造成的误解不仅针对译员,在现场关注会议的听众,新闻报道的受众,以及网上直播的观众都可能会误解为翻译是讯飞提供,因为不是所有人都熟悉讯飞听见。
第二点第三点牵涉的问题就比较复杂。王女士解释说其实他们考虑过如果用人工语音来替代翻译的语音确实会比较奇怪,(同时也向我提问,是否以后遇到这种情况可以寻求同传译员的许可,打出老师的名字或贴上老师的照片,或至少用文字标识表明有同传译员在翻译。这一点后面我们进行了讨论。)但最终结果是经过讨论,讯飞还是提供了tts的技术支持,目的是为以后可以实现的多语言平台进行演练(这里王女士解释了,比如一共有五种语言的与会者,可能一个小语种找不到翻译,那么可以借由其他译员翻译出来的文本作为中心语言,然后文本翻译到该小语种,再人工语音输出)。所以讯飞就提供了技术支持,但后续没有进行足够的把控,造成了译员感受到了侵犯,确实考虑不周。
我就进一步提出,后续没有控制,如果真是本身没有这种意愿,最终出现这种情况,那其实就是讯飞的营销或是公关部门工作问题,如果控制得好些,完全可以在同传语音保留的情况下增加第三个tts的频道,在对比下更能展示技术。王女士承认这方面确实本应做得更好。
然后我跟着说,讯飞确实官方多次声明提到过没有取代人工同传的意思,那么基于这种考虑,营销和公关部门应该是在媒体夸大炒作之后尽快进行辟谣和澄清,而不是等到夸大宣传激起激烈反弹后再应激式地去救火,还会让人感觉是讯飞默许了这种夸大宣传,客观上还从中得到了好处。而且舆论先受到了媒体炒作的影响(同时讯飞澄清不够),觉得讯飞的AI技术已经无所不能,远超讯飞自己的定位,结果这次出了这样的一个事件,很可能很多人态度又会180度转弯,瞬间觉得讯飞一无是处。王女士回答说确实作为一个科技公司在这方面缺乏经验,这次也是第一次他们遇到这么大的舆情事件,让他们感觉也很被动。而且现在社会中舆论容易被媒体影响,信任危机让人们很容易由于一次事件就完全失去信任。我就提到,讯飞作为多种程度上承载很多中国人希望的公司,如果不能做到对于这样的社会现状有准确的判断,进行前瞻性的准备而不是放任事情直到出事再救火,那么工作肯定是有问题的。王女士承认这是一次教训,事先的管控确实出现了问题,以后在面对可能的类似事件之前也需要进行预防性澄清。
至此第二点和第三点解释完毕。
在结尾我们还做了更多沟通。我提到在同传的业界中,(不论是否由讯飞导致)曾经出现过不止一次译员“被AI”,感觉到被免费利用,也有讲者在会上讲类似“感谢这次的人工智能同传,相信人类很快就要被取代”的话。王女士这时主动提出,她也听到过同传界或翻译公司的建议,是否应该在以后牵涉到讯飞提供技术的会议中,要与译员沟通,得到知情同意并签订协议。我说确实需要这个机制,而且协议需要分为两部分,第一部分是对于讯飞在会场提供的技术支持进行解释,包括呈现方式和运用的技术和其用途,需要得到译员的同意,并且需要在会场明确进行标识,说明翻译由译员提供;第二部分是关于译员翻译出来的内容,如果需要后续使用该内容(如用于语料积累或模型训练等),必须得到译员同意,否则不可使用。也就是说,一定要规范。王女士说,讯飞将探索这种机制的建立,并尽快执行。
另外,因为这次影响很大,很多我的同行都各自发声,有相对些激进,有些相对克制,我建议讯飞可以找机会跟同传界多进行正式的沟通,争取解除不必要的误会,寻求真正合作的可能。
作者在知乎上的地址是:https://zhuanlan.zhihu.com/p/45010541
我们来看看知乎上的樱桃羊的说法:同传译员看讯飞事件——技术无罪,侵权无理,造假无耻
我这篇文章发出来的初衷,就是为译员群体打抱不平,并且说明:我们没想打倒哪家公司,我们反对的是侵权的行为和弄虚作假,不管是谁,对事不对人。
发出来几个小时后,Bell也发了他的那篇声明,看过之后,我还挺高兴的,整个译员圈都很高兴,觉得这个事情终于有了一个圆满的结果,当时想着今天把这个消息加到文章里,既然讯飞表示是考虑不周、无心之失,我们也不要得理不饶人。
然而事情的反转真的超乎预料,译员圈今天都气炸了,因为今天一早看到Bell“被道歉”了。。。
OK,如果说之前的事情是讯飞无心之失,但这次把自己扮成受害人的样子,把Bell变成加害者的样子,也是无心之失考虑不周么?
既然如此,我文章还是放在这儿,不动。等这两天工作结束,咱们慢慢把事情掰扯清楚。
--------
这几天,同传这个职业的存在感可谓空前强烈,我也因此收到了许多媒体采访邀约,索性以他们的问题为大纲,好好整理了一下自己对这次讯飞事件的感想。
阅读警告:本文是目前为止我在知乎写过的最长的文章。
(一)您认为同传译员会被人工智能取代吗?
这个问题几乎每家媒体都在问。
虽然就此题目我可以写无数篇论文,但现在,我拒绝回答。
因为,在当前事件的背景下讨论该话题,属于模糊重点、混淆视听。
事情爆出来以后,许多媒体不断将话题往“译员会不会被AI取代”上头引。科大讯飞高管也在讲“我们动了谁的奶酪”,真是一语双关。段数更高一些的,会用安抚的口吻:“没想过要取代你们,也取代不了你们,放心吧。”
思路不清晰的还真要被带沟里去了,可是不好意思,解读言外之意恰好是咱们译员最擅长的本事。上述言论翻译一下,其实都一个意思:“你们闹得这么凶,无非就是怕被技术取代了呗。”
详情请看知乎:https://zhuanlan.zhihu.com/p/45223631
真相往往掌握在非习惯性思维中,我们不要去人云亦云,抓住其中的关键,以一种非习惯性思维去分析,真想其实很简单:
1、 同传AI目前不成熟,所以科大讯飞主推人机耦合技术
2、 9.20会议现场,Bell Wang进行同传翻译,然后科大讯飞把翻译出来的再转成文字,同时把文字转成机器语音给观众和听众。
3、 至于科大讯飞咬住不放的人机耦合技术能够为同传提供技术支持和指导,这一说法,同传翻译们都表示不可能,因为同传对人的要求很高,演讲者说出2-3s后,同传就必须进行翻译,超过这个时间达到4-5秒就是不合格的同传,上不了台面。如果从这方面来说,人机耦合就只能在其他非实时要求极高的场合对译者进行支持和参考了。当然,我们也希望人机耦合能进化到AI的高度,但是需要沉淀,更需要同传与技术的合作
4、 谜之处在于这起事件,为什么形成了这么大的影响,一篇知乎的文章竟然炒的沸沸扬扬,大有要上升到对整个AI失望的地步,其实,任何技术都有一个发展-成熟的过程,我们要本着包容的心态去看待。
其实,语音技术在全世界早就有研发,最早的鼻祖应该是IBM,记得八九十年代IBM就出来了ViaVoice,后来微软有必应,谷歌有各种语音技术。在中国台湾,还有一个叫做富迪科技的公司专注于语音技术研发有15年了,在智能家居、可穿戴装置、物联网、汽车、智能手机等平台上推出了其ForteVoice ®的技术及应用,特别是其麦克风阵列等硬件在行业内应用很多,其官网是www.fortemedia.com,台湾的公司做硬件还是不错的,有兴趣的可以去参考
那么科大讯飞的语音技术在世界上处于什么排名呢?在国内,我相信目前是做的最好的,虽然百度、阿里都在做,但是在语音识别,方言识别方面还是科大讯飞,但是据说在世界上的排名如下:1、谷歌,2、微软、IBM并列,3、xxx,4、中国的语音识别。当然排名并不能代表绝对的实力差距,各有各的优势,科大讯飞的优势可能在汉语方面,谷歌、微软、IBM在英语方面的实力肯定是首屈一指的。
同时,回到这次“造假”事件,网民们能相信吗?
真想上面已经分析了,科大讯飞没有造假,因为无假可造,顶多是来个偷梁换柱,但是也不能这么说。只是在大屏上让人们误认为这是科大讯飞进行的同传翻译,如果真的有重要人物问起来,我相信科大讯飞也不敢说这是他们的机器翻译的。科大讯飞真正想做的就是在面子上让大家觉得他们的技术已经很不错了,仅此而已吧。
但是科大讯飞这样的公关及格吗?
一个谎言不可怕,可怕的是不能有则改之,继续用一个又一个谎言来掩盖。看看马云对作假事件的处理吧。
一个有担当的公司在公众面前永远要当做孩子,事情错了就是错了,不要去狡辩或者解释,老老实实承认错误,并对公司人员进行惩处,对公众一个交代才是最好的公关。
科大讯飞为什么这么做?
其实很简单,他们缺乏故事、题材,对资本市场很依赖,在商业模式上缺乏有效的盈利模式。
在这里做一个小小的建议,也是笔者一直纳闷的:科大讯飞为什么不在输入法上面做做文章,做做广告?虽然很多人都说会影像体验,但是体验可以改进。我就曾经想过,如果一个产品能够成为输入法的提示或热点,那是不是一个极大的广告市场,但是这种广告千万不能影响用户体验。
从这次事件来看,科大讯飞技术较为深厚,但市场和公关却不严谨、对公众缺少应有的担当。
国内很多的企业还是小孩子,哪怕上市了,他们有的似乎还在襁褓之中,或者已经长大了一些,却还是带着小孩惯有的毛病,有时候为了博得用户们的青睐,撒个谎。但不管如何,科大讯飞还的技术还是不错,这个襁褓之中的婴儿,需要我们的呵护,我们还是多一点包容吧。
因为,哪怕现在我们口诛笔伐,三天后也许你就忘了:现在和以后你还在用着它的输入法呢^_^,其他,让资本和市场去检验一切吧。