同声传译短期内难以被人工智能替代 近几年来,随着人工智能在各个领域的大展身手,大有席卷一切行业的势头;曾几何时,各大国际会议都能见到某飞或者某度的人工智能同声翻译程序,有时候会议组委会也有兴趣赶一下人工智能的时髦,但是每当会议开始之后,与会嘉宾无不忍俊不禁,开始从错误翻译中找乐子,往往把严肃的国际会议开成一场朋友圈晒“人工低能”的灾难秀。到了这个时候,会议组织方不是关掉人工智能程序,就是紧急全城搜罗同声传译员现场救急,这种现象已经司空见惯,各大会议组织方开始主动远离人工智能翻译。 说到这里,我们不禁要问,固然人工智能翻译尚不成熟,但是我们还要多久可以用上能和人力媲美的人工智能翻译产品,尤其是人工智能同声传译呢? 笔者作为翻译行业十年的资深从业者,现在就从几条方面谈一谈。 人工智能归根接底,是一种程序化处理大数据的能力。 程序化首先要求有合理的建模,无论是云计算还是神经元计算,都是一种迭代了的计算方式,远不是最终最高级的建模方法,无论是数学的新进展,还是脑科学的新发现,都极易对这一最新方式产生迭代的影响。 而大数据,尤其是翻译大数据,有赖于近20年的数据积累,中外各方都积累的大量的中英语料,并通过上述程序化的语言分析比对,实际上包括谷歌微软百度都能在书面翻译上达到相当理想的成绩,很多参考级别的翻译都可以通过人工智能翻译做个大概,要求不高的话,勉强用用也是可以的。当然作为正式商用,还是需要人工校对整理才能交稿。 综上所述,目前人工智能翻译充其量只是大数据的利用。高度依赖程序建构和语料的精确程度。 和翻译一样,对于计算机来说,一段音频的解码到文字的输出,也是高度依赖程序建模和语音训练,这些年大数据工程师和语音训练师是大热行业,各大公司都希望自己的技术能独步天下,用的无非也是增加数据输入来提高准确度;任何一个人工智能语音识别服务器集群的受训语音引擎的输入量都远超作为个人的同声传译员,其数量级可能达到几万倍之多,但是充其量仍然是一个填鸭教学,语音引擎是一个好学生,但绝对不是一个聪明的学生。因为人的大脑根本就不是那样工作的,所以陈天桥直接略过人工智能的一切,直取脑科学,是有他深刻的思考的。 现阶段的人工智能同声传译就是语音识别技术乘以人工智能翻译,为什么是乘以,因为如果语音识别的准确率是80%,翻译的准确率是80%,那么人工智能同声传译的准确率只有64%,这还是相当理想的状况,如果遇到口音问题,或者现场音响设备状况不佳,甚至是会议内容的艰涩,或者发言稿的用词高雅,人工智能恐怕要胡说八道不知所云了。 近些年国内各大厂在语料问题上大伤脑经,努力收编各大语料库,作为一些老牌的翻译公司手上的几亿字的中外文对照稿,突然成了香饽饽,开始做起了语料生意,这是值得肯定的,大数据躺在那里不会产生价值,可利用产生价值,是好事,一来增加收入,而来降低了人工智能前期训练的成本。但是这里也蕴含了一个风险,这些语料的准确程度如何,语言对的方向有没有用错,大量中式英文和蹩脚的英中翻译是不是也进入了人工智能的大脑?用粗劣的语料能教出一个好的人工智能翻译家吗?一些高精尖的前沿知识,有现成的语料吗? 最后总结一下吧,在未来的几年里,一些大众化的简单的会议,再现场音响条件不错的情况下,人工智能同声传译在中英方向上会有良好的表现。但是英中部分,由于英文语音识别引擎的问题,各国与会人员口音的问题,表现仍将远不能满足一般会议要求。在专业性会议及小语种会议上,人工智能同声传译仍将是笑料一般的存在,未来20年内看不到改善的迹象,除非脑科学结合量子计算有重大突破。脑科学和量子计算的结合是真正的人工智能,我们这一代人或许可以看到那一天的到来,到那一天,没有人会再讨论翻译,因为人们打个照面就交流好了,不再有语言的隔阂,世界也真正统一成了全球村,也没有了各国诸侯的割地自肥,大家讨论的恐怕都是长生不老,精神世界的永存吧。 一,人工智能翻译究竟是不是智能?
二,语音识别技术是不是智能?
三,人工智能同声传译在现阶段是什么?