// 新刊推荐
// 中经传媒智库

科大讯飞欲借“人机耦合”洗脱AI同传造假嫌疑,专家说没有这个词

作者:钱丽娜 / 发布时间:2018-09-23/ 浏览次数:0

在外界看来,随着人工智能的发展,终有一天AI要取代同传。而在这一领域科大讯飞的呼声一直很高。

在上海国际会议中心举办的《2018创新与新兴产业发展国际会议》高端装备技术与产业分会上,与会者看到,“本次直播引入科大讯飞智能语音技术,实现了国际高端会议的中英文频道切换、智能翻译和自动语音播报……”

当天,参与当场会议的同声传译员Bell Wang却在知乎上写了一篇质疑科大讯飞的文章——《科大讯飞,你的AI同传操(qi)作(zha)能更风骚一点吗?》

在文中,他说,“哪有什么AI同传,明明是剽窃我这个人类同传译员!”

他提到,第一位出场的是位日本教授,英语非常酸爽。因为要直播,他注意到两边大屏幕下有实时字幕,赫然看到“讯飞听见”四个大字。

他发现语音识别中,翻译用于联系语句用的“就是”这种词也出现了。把“步态”显示为“不太”,“Davos Forum”(达沃斯论坛)显示为“Devils Forum”(魔鬼的论坛),完全和源语言内容对不上。

本以为仅仅是语音识别的问题,下午他发现知领直播的同传里传出的是机器人的声音,读的就是被讯飞识别转化成的文本!!

现场明明有人工同传,输出的也是同传的内容,却不放原音,一定要把有各种错误的语音识别文本用机器人读一遍。

Bell发现,这里的语音识别频频出错,原文是“I can mine this data and put it in charts(我可以挖掘数据并放入图表)to represent the status of the machine, we call it initial monitoring(以此表示机器的状态,我们称之为初步监控).”但讯飞识别成“minus data(减数据)”和“put it in charge(让它负责)”甚至是“college condition monitoring(大学状态监控)”

这篇文章一石激起千层浪,瞬间引爆了同传圈。

《商学院》记者立刻向一位同传询问此事,结果证实了Bell类似的遭遇。

记者询问同传是否有借助科大讯飞所称的“人机耦合”来帮助翻译,得到的回复是

为此,记者进一步向另一位同传求证,得到的回复是“近一两年以来,我们在同传会上,他们都会请到讯飞相关的专家。有一次在南京会上请到讯飞研究院的专家,说如果我们带同传机来,我们请的译员就不再用了。从2016年开始,很多公司都在说用AI同传取代人力同传,叫得响的是科大讯飞。”

记者请这位同传再去圈子里求证,得到了更多的资料。

“通常译员和客户中间隔着公关公司和翻译公司,公关公司有时都不一定知道用了机器同传。”在Bell将此事捅出之前,该同传告诉记者,“此前某公司从未提过人机耦合做同传。”

该同传透露,Bell是圈内水平很好的译员。知乎文出来后,主办方和翻译公司给他压力,不让他再谈,但知乎上,他拒绝删贴。

为此,该同传给记者一份在圈里得到认同的声明。

在今年9月17日召开的2018世界人工智能大会上,马化腾演讲时提到“今天大会讲台上大家会注意到两边屏幕上,这是腾讯同传的服务,这是科大讯飞翻译,中文字幕和英文翻译目前是我们后台机器完成的。人工智能在同声传译应用还处于初期,所以今天腾讯同传现场采用依靠机器完成,而不是人机协作,这是需要很大勇气,这是我们内部两个团队共同努力的结果。”

同传也告诉记者,“腾讯翻译君技术并不完美,不到商用水平,有很多噪点,但起码是真的。”

 

“人机耦合”一词从何而来?

 

据报道,9月21日晚,科大讯飞电话召开媒体交流会,说明了误解产生的前因后果,公司董秘、高级副总裁江涛携翻译业务的产品经理等回应了市场的一些质疑。江涛多次表示,“科大讯飞从没讲过AI同传的概念,始终强调是人机耦合的模式”。

科大讯飞称,目前公司提供两种方案:一是“全自动翻译”的方案,无需人工同传参与,现场机器翻译并同步展示在屏幕上,这被称为“AI离线翻译系统”;另一种方式是“人机耦合”,简单说,就是由机器提供语音转写和翻译结果给同声传译参考,辅助同传降低工作强度并提升效率,其中包括使用“讯飞听见”转写服务。

从科大讯飞的解释看,9月19日-20日“创新与新兴产业发展国际会议”上引发的风波,源于在沟通中与同声传译翻译员产生了误会。需要“人机耦合”使用的“语音转写系统”被当作了全自动的“AI离线翻译系统”。

科大讯飞公关部相关负责人给到《商学院》记者一纸声明:

但“人机耦合”究竟是什么定义,《商学院》记者前去询问科大讯飞上述负责人,截止发稿时对方一直未就此作答。

为此,记者又询问了两位专家。

北京航空航天大学人机与环境系统工程工学博士、剑桥大学访问学者刘伟教授给记者的回复是,“在人工智能里没有‘人机耦合’一词,但有‘人机融合’”。

苏州大学机电工程学院院长、博士生导师、国家“十五”863计划机器人技术主题专家孙立宁教授在给记者的回复中也称,“很少用‘人机耦合’,目前大量使用的是‘人机融合’,‘人机交互’等。”

刘伟教授的解释是,人机融合智能是由人、机、环境系统相互作用产生的新型智能系统。它结合了人与机器各自的优势,是跨物种越属性的下一代智能科学体系。它兼具人类智能的意向性和人工智能的计算性,可以灵活的协调人机融合智能问题中的各种矛盾和悖论。

而就“耦合”二字的字面意思,除去物理解释,刘伟教授认为应该被解释成“完美结合”。

孙立宁教授的解释是,随着机器与人的配合,可以更好地发挥人的智能和机器的认知优势,完成更复杂的工作。这个概念由低到高地发展。简单的遥控游戏机也算人机交互,但是人没有感受到机器人的一些感受,所以是单向的。双向交互才是更好地融合,比如当人受伤装假肢后,需要用意识信号来控制假肢行走,这就是典型的人机融合。又如,人在操作机器人时,人要能感受到机器人接收到的各种信息,机器也能很好地理解人的意图,这也是人机融合。

 

“人机耦合”究竟能否帮助同传?

 

虽然科大讯飞公关并未就“人机耦合”的定义作答,记者查询到人民网发表的一篇《科大讯飞董事长刘庆峰回应AI语音翻译三大质疑》。

文中提到,根据9月19日IEID主论坛刘庆峰的发言视频,他表示,本次会议翻译采用人机耦合形式,“今天这样一个科技讨论的场合,我们的翻译是人机耦合的,用我们的机器给同传做参考……使他做得更准确,使他更不容易疲劳。”

文中,据刘庆峰介绍,目前AI语音翻译主要包括两种模式:

一是全自动机器翻译。例如,9月17日上海举办的2018人工智能大会上,现场十余位嘉宾的发言只有三位用了人机协作转写同传老师语音的方式,其余均采取全自动机器翻译。

二是人机耦合同传。由机器为同传翻译者提供语音识别和机器翻译的结果,可以提高同传翻译的工作效率、降低同传翻译的工作强度。

此外,另一种人机耦合服务模式是机器转写演讲者源语和同传译员的译语,并把两种文字都显示在屏幕上,可以在直播中提供中英文字幕,以及方便没有耳机设备的人看到屏幕上的中英文会议内容。

在该报道中,科大讯飞品牌管理部负责人提到,“采用这种情况,我们会在会议中明确说明是同传语音转写。”

为此,同传业者推荐记者阅读一篇在圈里大热的关于人工智能同传的科普文《何为“人机耦合”?——大骗子?大骗子?大骗子?》

作者质疑的是声明中为何不提“人机耦合”的第二种情况。

作者提到,2013年,山东师范大学的林小木同学在硕士毕业论文《计算机辅助英译汉口译实证研究》曾做过一个仿真实验,验证计算机辅助口译需要在语音识别准确率达到多少时才会超过传统形式的口译,起到辅助作用。他当时并没有用科大讯飞的语音识别技术,而是参考了谷歌的语音识别结果和机器翻译结果。

简单来说,他的思路是这样的:

当发言人在用汉语发言时,通过语音识别技术将其汉语识别为中文文本,投射到口译员的屏幕上,并给出机器翻译的结果,供口译员参考。

实验结束后他对结果进行分析,得到以下启示:

记者咨询同传业者时,他们表示,现在人力同传就是个闭环,不用某飞耦合,不用其他形式的耦合,有支持系统就可以。

同传业者也告诉记者,他们的工作流程是这样的:

译员听到讲者的源语是,从00:00:00开始听,00:00.02时间点就开始翻。而某飞也是00:00:00接收信号,上屏的东西与译员译的同一个速度,那就帮不了译员。如果某飞机器进入讲者大脑提前5秒10秒知道讲者要讲什么,先转成文本,译员后序边听边视译,才能有前后耦合。

另一位同传告诉记者,在这种会议上,要验证是人还是机器同传其实很简单,“只要翻译停止说话,看还能不能出来翻译内容就知道是不是作假。”

《商学院》记者也将持续对此事进行关注。

除《商学院》杂志署名文章外,其他文章为作者独立观点不代表《商学院》杂志立场,未经允许不得转载。版权所有

欢迎关注平台微信公众号

 点赞 30
 收藏 20