你认为AI会干掉人类同声传译吗?当AI在围棋领域横扫人类后,人类对自己的职业技能似乎越来越没有自信,总担心自己的“饭碗”不保。
9月20日,2018年世界人工智能大会刚落幕,科大讯飞却陷入“AI同传造假”的风波。一位同传译员在知乎上发文称,在上海的一场会议中,讯飞的翻译其实为人工同传,并非机器智能翻译,并且译文由机器进行朗读。这容易让观众产生“都是人工智能翻译”的错觉,而忽略背后同传译员们的劳动成果。
对此,科大讯飞董秘、高级副总裁江涛接受《21世纪经济报道》采访时表示:“尽管机器翻译获得发展,明年能达到英语专业8级的水平,但依然没办法代替同传。科大讯飞没有提到AI同传,并没有造假吹牛,目前的情况是一个误会。”
一句“误会”虽然无法判断整个事件孰是孰非,但可以让人类的同传译员安心上班了。
15000个鸡蛋和绝望的主厨
同声传译是指译员在不打断讲话者的情况下,不间断地将讲话者的内容翻译后复述给听众。传译员通过同传设备提供即时准确无误的翻译,这种翻译方式适用于大型的权威研讨会和国际性会议。
同声传译这个职业曾被誉为世界上最高薪酬的工作,他们的工资不是按照“月”计算,而是以“每小时”乃至“每分钟”作为计量单位。这个“日进千金”的行业看似风光,实则每次传译员出一次任务都是一场风暴似的脑力压榨。
目前国际情况,世界上95%的国际高端会议都会采用同声传译的方式进行。但“同声传译”的历史并不久,第二次世界大战结束后,德国纽伦堡国际军事法庭在审判法西斯战犯时,才首次采用同声传译。
创新工场董事长兼首席执行官李开复认为,一项本来由人从事的工作,如果可以在5秒钟内,对工作中需要思考和决策的问题做出相应决定,那么,这项工作就有非常大的可能被人工智能全部或部分取代。
按照这一说法,同声传译则是被人工智能取代的危险工种之一,但目前来看结果并不理想。
今年4月9日,的博鳌亚洲论坛上,腾讯的AI翻译产品“翻译君”就出了不小的翻译事故。当天,在博鳌分论坛会场两侧的大屏幕上,各国嘉宾的演讲内容被腾讯翻译君实时识别,并翻译成中英双语字幕进行投屏展示。同时,现场观众不断利用微信小程序对嘉宾演讲的双语同传内容进行回看、收听和记录。除了一些无意义重复的低级错误外,AI对“一带一路”等专有词汇也不太了解,翻译成“中国的一条公路和一条腰带”。
这不是机器翻译第一次闹笑话,科大讯飞、搜狗等都因为机器翻译犯过错,就连谷歌也不例外。据中国新闻网报道,今年2月4日,在韩国平昌冬奥会上,为了给121名运动员备餐,挪威队主厨用号称是神经网络翻译的谷歌翻译订购1500个鸡蛋,却因翻译错误收到15000个鸡蛋。收到这么多鸡蛋,主厨内心应该是绝望的:到底什么时候能吃完?
酸爽的日式英语打败AI
AI翻译出错,最高兴的要数人类译员,毕竟两者是“抢饭碗”的敌对关系。
2017年6月,科大讯飞发布全球首款实时中英互译神器——晓译翻译机。当时许多宣传文章称,这款产品“可以让人工同传消亡”,“是同声传译终结者”。这些夸大的字眼引起广大同传工作者的不满。科大讯飞董事长、创始人刘庆峰今年3月,微软宣布“其研发的机器翻译系统首次在通用新闻翻译的汉译英达到人类专业水平,超越业余译者,实现自然语言处理里程碑突破”,结果引起诸多吐槽、分析和评测,并一度掀起了对AI翻译到底能否媲美甚至超越人类,AI翻译的进展到底会对人类翻译员产生什么影响等问题的讨论。
在本届世界人工智能大会上,讯飞听见和腾讯同传两家语音转文字产品同台亮相。马化腾当天在主题演讲时表示“腾讯同传现场采用依靠机器完成,而不是人机协作”;随后上台演讲的科大讯飞董事长刘庆峰则说:“我们希望用机器帮助顶尖同传更好的发展他的能力,机器和人未来必须是协同的。”
在产品表现方面,两家公司最后打了个平手:从英文流利程度来看,似乎腾讯同传更胜一筹。每逢嘉宾进行演讲语种切换,而科大讯飞的现场反应速度需要更长时间。
直到一位名叫ToshioFukuda的日本科学院院士上台演讲,腾讯同传直接“罢工”,科大讯飞则将现场人类同传的中文语音转文字继续工作。也因此,科大讯飞被同传工作人员视为“造假”。日式英语一直都是很“酸爽”的存在,看来在AI这也没能避免。
而此时,没有噱头也没有出错的人类,更像是当天同传工作的主角。和以往一样,同传工作人员被安排在所有座位后方的一间口译室中,轮流透过耳机接收讲者的信息,然后对着麦克风进行翻译。坐于会场中的听众通过特殊的音讯接收设备,收听着同声传译员的翻译。
同传,比文本翻译难多了
在大型会议上,使用AI同传为什么总是出错?最根本的原因,同传本就比文本翻译难多了。
能做到同传的人,无疑是语言方面的天才。让AI去做同传,则是让人工智能处理自然语言,但人工智能显然不具备“天赋”——简单地说,AI做翻译,靠的是海量分析数据和帮助AI进行学习的模型及优化算法。
就好比AI已经彻底“打败”人类的围棋,后者就可以算是最规整的数据了——棋盘上只有361个位置可以下,也只有黑白两种棋子。更不要提人类上千年来保留的数以千万计的棋谱。在AlphaGo最后超越人类那一步时,甚至还开始通过自我对弈来生成全新的数据。
翻译其实也是一个拥有很多“优质数据”的内容——因为世界上很多的文学作品,都有不同语种的译本。更不要提在线翻译服务中海量的使用和反馈记录了,所以文本翻译这件事,也算是AI最早有所进展的领域了。
然而,同传并不只是翻译,更准确地说是“转写+翻译”。相比格式规范,字母、单词书写方式都一样的实体内容,英语的口语发音实际上要复杂的多。要知道,英语这种国际通用语言,在结合各国的口音后,已经衍生出一大堆变化。除了日式英语,印度、俄罗斯等地区的英语也颇具特色。在B站上,还有一段67种英语口音的汇总视频。
口语还没有标点符号来标记句子,缺少了必要的声调和停顿,就很容易造成句子的歧义。而模糊的指令对AI来说,极有可能出现满屏的乱码。
国际会议的现场同传,更要考虑会场噪音、每个人口音、停顿语气词等语音信号会对后面的翻译产生影响;会议对于及时性要求更高,不可预知情况很难控制,很难给机器足够的自我调整时间,要解决机器翻译对未知困难的自适应性,相对较难。此外,会议现场专业度高、覆盖度广,AI对特殊场景的理解还不够。场景对于语义具有至关重要的影响,相同的一句话在不同场景里有不同意思。
每个人,都要提前想想怎么应对AI
事实上,就连人类同传无法做到百分百传译,根据AIIC(国际会议口译员协会)的规定,同传译员只要翻译出演讲者内容的80%就已经算是合格。这意味着AI工作量减少吗?当然不,正是这种模糊的东西使得AI同传更加困难。
去年6月,科大讯飞在公司公上发文称,AI翻译已经取得非常大的进步,在衣食住行等常用生活用语上的中英翻译可以达到大学六级的水平,能够帮助人们在一些场景处理语言交流的问题,但距离会议同传及高水平翻译所讲究的“信、达、雅”还存在很大差距。
该文章称,科大讯飞一直所努力的,是希望通过语音转写和翻译技术帮助同传提高工作效率、减少失误,形成人机耦合的同传新模式。
目前,AI已经能够完成绝大部分英语比较好、口音不重的转写和翻译任务。人类同传只需要应对日式英语、俄式英语这样更棘手的任务。对于AI来说,一旦集中资源训练出一个“神经网络”,剩下的事情无非就是把这个“神经网络”复制,添加更多硬件算力。
但同时,AI同传在可预期的时间内(十数年)又不能达成完全超越人类的能力。最终形成一个极度“尴尬”的境地——AI和人工各有所长,经济和模式趋势“逼迫”两者必须合作。
在人类与AI“合作”的过程中,人类或许很难进一步提升自我,AI却会进一步成长、逼近。机器对此自然不会带有情感,但人类却会面对低等级的劳动力不断被取代的“压迫感”。所以不夸张地说,我们是时候提前想想自己怎么和AI一起工作下去了。
●资料来源:虎嗅网、亿欧网、澎湃新闻等
直到一位名叫ToshioFukuda的日本科学院院士上台演讲,腾讯同传直接“罢工”,科大讯飞则将现场人类同传的中文语音转文字继续工作