广告

从人机耦合到人机大战,科大讯飞“造假”事件来龙去脉及真相之谜

导语:又是真相,又是之谜,感觉这个标题很混沌,可能就像科大讯飞现在的处境一样,2018.9.17-9.19 《2018世界人工智能大会》,9.20紧接着的《2018创新与新兴产业发展国际会议(IEID)》,语音方面的AI,好好的一手牌,却打得稀巴烂。

又是真相,又是之谜,感觉这个标题很混沌,可能就像科大讯飞现在的处境一样,2018.9.17-9.19 《2018世界人工智能大会》,9.20紧接着的《2018创新与新兴产业发展国际会议(IEID)》,语音方面的AI,好好的一手牌,却打得稀巴烂。

在众多媒体口诛笔伐的情况下,科大讯飞哪怕已经做出了回应和澄清。我们来捋一捋这次同传事件的来龙去脉,然后探究其背后的真相,再找出这个真相的谜之处。
本文大纲:
1、 9.20知乎网友Bell Wang爆料科大讯飞“造假”
2、 人机耦合:9.21科大讯飞回应
3、 人机大战:9.21-9.24科大讯飞“造假”事件发酵
4、 9.25科大讯飞澄清
5、 9.25 Bell Wang的声音
6、 同传同行的声音
7、 真相之谜
8、 客观评价

一、首先:知乎网友“Bell Wang”爆料

01.jpg

二、人机耦合:9.21 科大讯飞第一次回应

9月21日晚间20点,科大讯飞官方对此事进行了专门回应,表示科大讯飞用的是人机耦合技术,认为是沟通不足造成的一场误会。

科大讯飞第一次声明.jpeg

三、人机大战:9.21-9.24科大讯飞“造假”事件发酵

科大讯飞官方敷衍式的回应后,媒体铺天盖地进行了各种报道,事件深度发酵,本来是人机耦合技术,现在转变成人机大战,科大讯飞估计如坐针毡,如履薄冰,坐立不安。


四、9.25 科大讯飞澄清

官方主要澄清内容,主要如下::
1、科大讯飞从未“隐瞒”转写同传声音
2、科大讯飞不存在侵犯同声传译知识产权的可能性
3、科大讯飞技术既能转写也能翻译4、机器翻译明年将达英语专业八级水平,可以较好满足日常交流需要,但还无法代替同传
5、“人机耦合”不仅是技术发展的趋势,更是社会伦理发展的要求
6、我们将用法律武器维护公司声誉。
以下为官方回应全文:

各位讯飞同事:
大家好! 最近,网络上出现大量关于对科大讯飞AI同传进行的讨论,甚至出现了带有恶意抹黑目的的文章。一位同声传译人员因为在工作中把讯飞听见的转写功能误会成机器同传,从而引发了这次的讨论。 9 24 日,消费者BG副总裁、听见科技总经理王玮与该人士进行了充分沟通和说明,该人士随后发帖表示科大讯飞没有造假
沟通发现,这次误解产生的一个原因是:对这次会议如何使用讯飞听见系统的字幕技术应用和展示方式,承办方已两次对会务公司及翻译公司提前做了说明,并要求翻译公司提前告知同声传译。该名同传称这一点上,我倒确实后来听相关方说,跟我确定会议相对晚,据说其他译员老师被通知了,可能是因为我确定晚漏了我一个确实是情绪有些激动,比较不好意思
我们必须明确地告诉大家:科大讯飞没有造假。为了让各位同事充分了解事情来龙去脉,特地还原事实如下:
9 19 20 日,创新与新兴产业发展国际会议在上海举办,这个会议由中国工程院与上海市人民政府、工业和信息化部共同举办,会议主办方明确表示,采用讯飞听见智能会议系统,对演讲人员的语音及同传人员的语音进行实时转写文字上屏,这个具体方案的实施,事前主办方已与科大讯飞、翻译公司进行过充分沟通并达成一致意见。而对现场同传人员上屏文字进行语音合成并进行直播,都是主办方提出的具体会务需求,科大讯飞仅为此提供技术支持,直播过程与科大讯飞并无关联。会议主办方和中国工程院明确表示,科大讯飞没有造假,并充分肯定科大讯飞技术成果的领先性。
1科大讯飞从未隐瞒转写同传声音
考虑到“ 2018 创新与新兴产业发展国际会议的学术背景和所涉及专业,会务组选择了用讯飞听见转写演讲者和同声传译的语音。
对这项方案,会务组与本次会议合作的会务公司及翻译公司都在会前充分沟通并达成一致,并要求翻译公司告知同传人员。
此外,会务组同时要求科大讯飞对现场同传人员上屏文字进行语音合成,并通过知领直播平台同步直播,其目的是为进一步展示智能语音合成技术最新成果。
这次提供的技术方案,都是应主办方要求提供的,对各方都是充分透明的。为期两天的会议过程中,科大讯飞一直按照既定方案进行会议支持,上会的是讯飞听见,而非机器翻译。另外,在 9 19 日下午,科大讯飞董事长刘庆峰在会议主论坛上发表的《共建人工智能创新体系》主题演讲中,也对同传语音转写进行了明确的说明。
在整个过程中,我们始终秉持阳光、透明和实事求是的沟通原则,这也是我们长期坚守的基本价值观。
2、科大讯飞不存在侵犯同声传译知识产权的可能性
科大讯飞和同传译员都是会务组的技术服务支持方,科大讯飞在此过程中不存在侵犯译员知识产权的可能性。相关知识产权保护问题可以参考AIIC-United Nations Agreement(联合国国际会议口译员协会协议)
根据AIIC-United Nations Agreement(联合国国际会议口译员协会协议)第四部分Working Conditions(工作条件)关于Disclaimer for broadcasting(广播免责声明)的一条,原文如下:An audio/video file of interpretation shall be the property of the employing Organization. (口译的录音/录像文件为雇主组织产权所有)
3、科大讯飞技术既能转写也能翻译
发帖的同声传译在现场看到两张屏幕,一张显示演讲者演讲的英文文字,一张显示同声传译的中文文字,但这并不代表科大讯飞只有转写功能,没有机器翻译功能。讯飞听见智能会议系统是一款中英文语音实时转写和多语种实时翻译系统。它有两套方案,一套具有机器翻译的功能,在会议现场进行全自动离线翻译并同步展示在屏幕上,没有任何人工同传参与,logo显示为讯飞听见--AI离线翻译系统”;另一套具有听见转写的功能,会议的发言语音转写成文字上屏,Logo显示为讯飞听见。这两套方案在不同的会议场景都会使用。
事实上, 9 17 日的上海世界人工智能大会上,讯飞听见的两种翻译模式就得到了应用,并为多位嘉宾提供了全自动离线翻译服务。
9 17 日上午重要的主论坛上,现场一共十二位演讲嘉宾,除了其中三位用了人机协作听见转写的方式,其余全部使用讯飞全自动离线机器翻译,包括马云、马化腾、李彦宏、雷军等嘉宾发言,科大讯飞都是提供离线机器翻译功能,现场同步将中英文展示在屏幕上。
根据后台数据统计,科大讯飞机器翻译服务目前每天达 650 多万次。大家可以通过下载讯飞听见APP,在手机上先行体验讯飞转写及翻译效果
4、机器翻译明年将达英语专业八级水平,可以较好满足日常交流需要,但还无法代替同传
目前,科大讯飞的机器翻译已经达到大学六级水平, 2019 年将达到英语专业八级水平。
讯飞翻译机自推出以来,机器翻译的功能在天猫和京东的用户好评率都达到99%,可以较好满足日常交流需要,但机器翻译水平还无法代替同传。
比如,在会议场合,尤其是涉及到政治、技术和较为敏感或专业的会议,并不是完全字对字的翻译便可传递演讲者的信息,同声传译译员需要整合演讲者话语,传达演讲者的意图和态度,而目前这是机器翻译很难做到的。这也是科大讯飞探索人机耦合道路的另一个原因——让机器成为同传的助手,提升同传工作效率和准确度。
5人机耦合不仅是技术发展的趋势,更是社会伦理发展的要求
人机耦合包括两种方式,一是人和机器来共同完成一项任务(比如通过机器转写和同传翻译实现大屏幕的展示,可以通过语音合成将同传老师的文字合成为多语种声音),第二个就是机器作为助手,辅助人来完成某一项任务(比如科大讯飞与上海外国语大学合作的口译助手”)
早就在 2016 年的讯飞年度发布会上,科大讯飞董事长刘庆峰就首次提出人机耦合的概念,并展望人和机器的深度耦合将会带来人类的智慧大爆炸
2017 10 21 日,科大讯飞牵手上海外国语大学成立了上海外国语大学-科大讯飞智能口笔译研究联合实验室,希望通过和上海外国语大学合作,探索培养译员、辅助译员工作的新方式,通过机器与人的协作:帮助同传译员,工作时提供转写和翻译结果作为参考,提升准确率,减轻短期记忆压力;帮助交传译员,减轻笔记压力,提升准确率。
而在今年的重庆智博会”( 8 23 )和上海世界人工智能大会”( 9 17 )上,刘庆峰进一步提出,人工智能下一步的关键是算法的突破、数学统计建模方法和脑科学研究的深度结合以及人机耦合的持续探索。
9 19 日的 2018 创新及新兴产业发展国际会议主论坛上,刘庆峰明确提到,未来一定不是机器代替人,而是人机耦合的,科大讯飞已经和上海外国语大学在研究人机耦合的方式,我们希望用机器帮助我们顶尖的同传更好地发展他的能力。未来,机器和人必须是协同的
6、我们将用法律武器维护公司声誉
我们一直本着善意和各方沟通交流。本次沟通说明之后,事实真相已非常清晰。我们感谢社会各界对科大讯飞的信任、关心与支持。对于继续抹黑科大讯飞,捏造虚假信息,误导公众,损害我司名誉权的机构或个人,我们将保留诉诸法律的权利。
比人类更强大的,绝不是AI,而是掌握了AI的人类,这是科大讯飞一直秉持的核心价值观。早在 2017 6 29 日,科大讯飞官方微信就专门发文《科大讯飞:拒绝神化人工智能技术需踏实前行》,呼吁各界不要对还在发展中的新技术过度神化,以免对大众造成错误引导,从而不利于产业生态持续健康发展。
本次事件中部分同传老师的关切和疑虑,也值得我们认真考虑并在今后工作中吸收。科大讯飞期待和不同的行业专家握手对话,用AI为各行各业赋能。
未来,我们将一如既往践行让机器能听会说、能理解会思考,用人工智能建设美好世界的使命,顶天立地,踏实前行。
科大讯飞消费者事业群
安徽听见科技有限公司

2018 9 25

五、Bell Wang的声音

先看作者的总结:
我觉得科大讯飞的王玮女士展现出了诚意,沟通过程中一直友好理性。这次的解释是让我能够接受的,从我的角度看,可以认为讯飞没有主动造假的行为,但是讯飞的营销和公关存在比较大的问题,客观上放任了媒体的过分宣传,导致了各方的误会。
讯飞表示在以后的工作中需要更有前瞻性,在营销和公关的把控上必须严格,要在发现媒体过度宣传的时候就尽早进行澄清,并且在以后可能的技术呈现过程中充分做好标识,避免误会。
最后我们进行了更多交流,我提出建议,讯飞在未来与译员可能合作时,需要得到译员的知情同意,并签订协议,而且需要应用译员知识产权的翻译内容时,也需要得到许可,否则不可使用。讯飞承诺将尽快探索这一机制并执行。并且,这次事件激发了很多来自业界的讨论,我也提出希望讯飞能主动进行联系沟通进行澄清。


最后补充几句题外话:
本身我写前一篇文章的时候,考虑得也十分简单,就是感觉受到了不公的待遇,要将自己的经历写出来。而且当时多少情绪也比较激动,有些措辞比较激烈。结果后来自然也被解读了,还有人说我是“带着任务来的”。之后事情影响越来越大,各个媒体,甚至外媒都开始报道以及引用我的文章。不仅如此,业内的朋友们也开始在我身上寄托很多期望,希望维护合理的权利和诉求。这时我才意识到,发声一定要谨慎,即使我描述了事情的经过,但几句不谨慎的话还是会引起麻烦。于是我决定不再评论回复(看都不看了,免得心烦),也拒绝了所有媒体的采访请求。这里还是再说一遍,我从未委托任何人代替我发声,我自己说的也仅仅代表我自己,我也没有权力代表同传行业,我只能从自己的角度去聆听,并得出自己的结论。但这次我觉得最有价值的还是结尾的讨论。澄清事件解释误会都只是对过去的总结,关键还是在于事件能否对未来有积极的影响。如果这次事件真的能建立事先沟通机制,保护好译员的权利,规范化知识产权的使用,并且能让大家理性看待AI技术,不要不理性地拔高或贬低,那我觉得这次事件就不是一次闹剧,而是一次真正产生价值的事件。

我们回过来看看全文:


这篇文章因为是整理语音交流内容,可能会比较乱。如果有人觉得太长不愿意看,可以跳过中间直奔结论。
昨天,我得知科大讯飞想要和我进行沟通,将事情来龙去脉解释清楚并澄清一些误会。我觉得这样做确实会让事情清楚一些,比两边隔空喊话要高效很多,于是就答应了。
今天,我就与科大讯飞消费者事业群副总裁,听见科技总经理王玮女士进行了语音沟通。整个交流持续了大约一小时十分钟。我们双方都留了录音。
一开始我先解释了下在文章中我的一些激烈用词(囧),确实是情绪有些激动,比较不好意思,然后我就提出了在我文章中主要的几个问题。一个就是现场字幕的问题,事先我并没有得知有讯飞参与,也没有人征求我的同意,并且只有“讯飞听见”几个字还是很容易让观众误解为是讯飞提供的字幕翻译,也会让同传译员误解,感觉受到不尊重。二是直播的同传音轨使用tts语音合成而不是直接用同传译员的翻译音轨,同时知领的直播介绍中的文字说有“智能翻译”功能,对观众非常有误导性,有欺骗嫌疑。同时还提到了我后来想到的一点,就是讯飞作为这样一个大影响力的公司,是不是在营销和公关上控制不足,导致很多误会。


王女士先解释了第一点。讯飞听见之前也在几次比较有影响力的会议上有所使用,应该已经有不少人熟知,而这次的会议其实有很多的承办方,并且有会务公司和翻译公司的参与。王女士表示科大讯飞在多次的筹备会议中明确要求要通知到所有相关方会有讯飞听见的字幕技术应用和展示,是不是哪一环沟通出现了问题。这一点上,我倒确实后来听相关方说,跟我确定会议相对晚,据说其他译员老师被通知了,可能是因为我确定晚漏了我一个。那这点上我觉得这个解释可以接受,但遗留的问题就是,这种情况下造成的误解不仅针对译员,在现场关注会议的听众,新闻报道的受众,以及网上直播的观众都可能会误解为翻译是讯飞提供,因为不是所有人都熟悉讯飞听见。


第二点第三点牵涉的问题就比较复杂。王女士解释说其实他们考虑过如果用人工语音来替代翻译的语音确实会比较奇怪,(同时也向我提问,是否以后遇到这种情况可以寻求同传译员的许可,打出老师的名字或贴上老师的照片,或至少用文字标识表明有同传译员在翻译。这一点后面我们进行了讨论。)但最终结果是经过讨论,讯飞还是提供了tts的技术支持,目的是为以后可以实现的多语言平台进行演练(这里王女士解释了,比如一共有五种语言的与会者,可能一个小语种找不到翻译,那么可以借由其他译员翻译出来的文本作为中心语言,然后文本翻译到该小语种,再人工语音输出)。所以讯飞就提供了技术支持,但后续没有进行足够的把控,造成了译员感受到了侵犯,确实考虑不周。


我就进一步提出,后续没有控制,如果真是本身没有这种意愿,最终出现这种情况,那其实就是讯飞的营销或是公关部门工作问题,如果控制得好些,完全可以在同传语音保留的情况下增加第三个tts的频道,在对比下更能展示技术。王女士承认这方面确实本应做得更好。


然后我跟着说,讯飞确实官方多次声明提到过没有取代人工同传的意思,那么基于这种考虑,营销和公关部门应该是在媒体夸大炒作之后尽快进行辟谣和澄清,而不是等到夸大宣传激起激烈反弹后再应激式地去救火,还会让人感觉是讯飞默许了这种夸大宣传,客观上还从中得到了好处。而且舆论先受到了媒体炒作的影响(同时讯飞澄清不够),觉得讯飞的AI技术已经无所不能,远超讯飞自己的定位,结果这次出了这样的一个事件,很可能很多人态度又会180度转弯,瞬间觉得讯飞一无是处。王女士回答说确实作为一个科技公司在这方面缺乏经验,这次也是第一次他们遇到这么大的舆情事件,让他们感觉也很被动。而且现在社会中舆论容易被媒体影响,信任危机让人们很容易由于一次事件就完全失去信任。我就提到,讯飞作为多种程度上承载很多中国人希望的公司,如果不能做到对于这样的社会现状有准确的判断,进行前瞻性的准备而不是放任事情直到出事再救火,那么工作肯定是有问题的。王女士承认这是一次教训,事先的管控确实出现了问题,以后在面对可能的类似事件之前也需要进行预防性澄清。


至此第二点和第三点解释完毕。


在结尾我们还做了更多沟通。我提到在同传的业界中,(不论是否由讯飞导致)曾经出现过不止一次译员“被AI”,感觉到被免费利用,也有讲者在会上讲类似“感谢这次的人工智能同传,相信人类很快就要被取代”的话。王女士这时主动提出,她也听到过同传界或翻译公司的建议,是否应该在以后牵涉到讯飞提供技术的会议中,要与译员沟通,得到知情同意并签订协议。我说确实需要这个机制,而且协议需要分为两部分,第一部分是对于讯飞在会场提供的技术支持进行解释,包括呈现方式和运用的技术和其用途,需要得到译员的同意,并且需要在会场明确进行标识,说明翻译由译员提供;第二部分是关于译员翻译出来的内容,如果需要后续使用该内容(如用于语料积累或模型训练等),必须得到译员同意,否则不可使用。也就是说,一定要规范。王女士说,讯飞将探索这种机制的建立,并尽快执行。


另外,因为这次影响很大,很多我的同行都各自发声,有相对些激进,有些相对克制,我建议讯飞可以找机会跟同传界多进行正式的沟通,争取解除不必要的误会,寻求真正合作的可能。
作者在知乎上的地址是:https://zhuanlan.zhihu.com/p/45010541

六、同传同行的声音

我们来看看知乎上的樱桃羊的说法:同传译员看讯飞事件——技术无罪,侵权无理,造假无耻

我这篇文章发出来的初衷,就是为译员群体打抱不平,并且说明:我们没想打倒哪家公司,我们反对的是侵权的行为和弄虚作假,不管是谁,对事不对人。

发出来几个小时后,Bell也发了他的那篇声明,看过之后,我还挺高兴的,整个译员圈都很高兴,觉得这个事情终于有了一个圆满的结果,当时想着今天把这个消息加到文章里,既然讯飞表示是考虑不周、无心之失,我们也不要得理不饶人。

然而事情的反转真的超乎预料,译员圈今天都气炸了,因为今天一早看到Bell“被道歉”了。。。

OK,如果说之前的事情是讯飞无心之失,但这次把自己扮成受害人的样子,把Bell变成加害者的样子,也是无心之失考虑不周么?

既然如此,我文章还是放在这儿,不动。等这两天工作结束,咱们慢慢把事情掰扯清楚。

--------

这几天,同传这个职业的存在感可谓空前强烈,我也因此收到了许多媒体采访邀约,索性以他们的问题为大纲,好好整理了一下自己对这次讯飞事件的感想。

阅读警告:本文是目前为止我在知乎写过的最长的文章。

(一)您认为同传译员会被人工智能取代吗?

这个问题几乎每家媒体都在问。

虽然就此题目我可以写无数篇论文,但现在,我拒绝回答。

因为,在当前事件的背景下讨论该话题,属于模糊重点、混淆视听。

事情爆出来以后,许多媒体不断将话题往“译员会不会被AI取代”上头引。科大讯飞高管也在讲“我们动了谁的奶酪”,真是一语双关。段数更高一些的,会用安抚的口吻:“没想过要取代你们,也取代不了你们,放心吧。”

思路不清晰的还真要被带沟里去了,可是不好意思,解读言外之意恰好是咱们译员最擅长的本事。上述言论翻译一下,其实都一个意思:“你们闹得这么凶,无非就是怕被技术取代了呗。”

详情请看知乎:https://zhuanlan.zhihu.com/p/45223631


七、真相之谜

真相往往掌握在非习惯性思维中,我们不要去人云亦云,抓住其中的关键,以一种非习惯性思维去分析,真想其实很简单:
1、 同传AI目前不成熟,所以科大讯飞主推人机耦合技术
2、 9.20会议现场,Bell Wang进行同传翻译,然后科大讯飞把翻译出来的再转成文字,同时把文字转成机器语音给观众和听众。
3、 至于科大讯飞咬住不放的人机耦合技术能够为同传提供技术支持和指导,这一说法,同传翻译们都表示不可能,因为同传对人的要求很高,演讲者说出2-3s后,同传就必须进行翻译,超过这个时间达到4-5秒就是不合格的同传,上不了台面。如果从这方面来说,人机耦合就只能在其他非实时要求极高的场合对译者进行支持和参考了。当然,我们也希望人机耦合能进化到AI的高度,但是需要沉淀,更需要同传与技术的合作
4、 谜之处在于这起事件,为什么形成了这么大的影响,一篇知乎的文章竟然炒的沸沸扬扬,大有要上升到对整个AI失望的地步,其实,任何技术都有一个发展-成熟的过程,我们要本着包容的心态去看待。

八、客观评价

其实,语音技术在全世界早就有研发,最早的鼻祖应该是IBM,记得八九十年代IBM就出来了ViaVoice,后来微软有必应,谷歌有各种语音技术。在中国台湾,还有一个叫做富迪科技的公司专注于语音技术研发有15年了,在智能家居、可穿戴装置、物联网、汽车、智能手机等平台上推出了其ForteVoice ®的技术及应用,特别是其麦克风阵列等硬件在行业内应用很多,其官网是www.fortemedia.com,台湾的公司做硬件还是不错的,有兴趣的可以去参考
那么科大讯飞的语音技术在世界上处于什么排名呢?在国内,我相信目前是做的最好的,虽然百度、阿里都在做,但是在语音识别,方言识别方面还是科大讯飞,但是据说在世界上的排名如下:1、谷歌,2、微软、IBM并列,3、xxx,4、中国的语音识别。当然排名并不能代表绝对的实力差距,各有各的优势,科大讯飞的优势可能在汉语方面,谷歌、微软、IBM在英语方面的实力肯定是首屈一指的。

同时,回到这次“造假”事件,网民们能相信吗?

真想上面已经分析了,科大讯飞没有造假,因为无假可造,顶多是来个偷梁换柱,但是也不能这么说。只是在大屏上让人们误认为这是科大讯飞进行的同传翻译,如果真的有重要人物问起来,我相信科大讯飞也不敢说这是他们的机器翻译的。科大讯飞真正想做的就是在面子上让大家觉得他们的技术已经很不错了,仅此而已吧。

但是科大讯飞这样的公关及格吗?

一个谎言不可怕,可怕的是不能有则改之,继续用一个又一个谎言来掩盖。看看马云对作假事件的处理吧。

一个有担当的公司在公众面前永远要当做孩子,事情错了就是错了,不要去狡辩或者解释,老老实实承认错误,并对公司人员进行惩处,对公众一个交代才是最好的公关。

科大讯飞为什么这么做?
其实很简单,他们缺乏故事、题材,对资本市场很依赖,在商业模式上缺乏有效的盈利模式。
在这里做一个小小的建议,也是笔者一直纳闷的:科大讯飞为什么不在输入法上面做做文章,做做广告?虽然很多人都说会影像体验,但是体验可以改进。我就曾经想过,如果一个产品能够成为输入法的提示或热点,那是不是一个极大的广告市场,但是这种广告千万不能影响用户体验。

从这次事件来看,科大讯飞技术较为深厚,但市场和公关却不严谨、对公众缺少应有的担当。
国内很多的企业还是小孩子,哪怕上市了,他们有的似乎还在襁褓之中,或者已经长大了一些,却还是带着小孩惯有的毛病,有时候为了博得用户们的青睐,撒个谎。但不管如何,科大讯飞还的技术还是不错,这个襁褓之中的婴儿,需要我们的呵护,我们还是多一点包容吧。

因为,哪怕现在我们口诛笔伐,三天后也许你就忘了:现在和以后你还在用着它的输入法呢^_^,其他,让资本和市场去检验一切吧。

 

整理
本文为机器人网原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
相关文章
广告
广告
广告
广告
推荐使用浏览器内置分享