从冷战到深度学习——机器翻译的历史
2018-03-13 本文已影响20人
5516f553a4ca
现在去异国他乡旅游,智能手机里除了GPS,你还一定会安装一种翻译软件:必应翻译,有道词典或者谷歌翻译等等,它将是你在国外使用最频繁的软件。买东西,坐地铁,看标识都需要它,让你感到前所未有的便利。机器翻译日趋成熟和完美,不禁感叹,科技改变生活!
最初的机器翻译雏形是前苏联科学家发明的,由一台摄影机和一台打字机同步工作,摄影机取得文字的影像,打字机打出对应文字,也许叫“机械翻译”更为恰当。现代的基于计算机的机器翻译经历了下列重要的技术里程碑:
一是基于语言规则的机器翻译,简单地说,就是让机器一个字一个字地查字典,其中有一种加入中间语言的翻译方式会成为现代机器翻译的基本思想:就是先把一种语言翻译成国际语言,再从国际语言翻译为目的语言,由于这种国际语言难以被创造,被暂时抛开;
接着是基于范例的机器翻译,基本思想是用机器里保存的现成的语言例子去套新的语句,只要翻译新的字词,加在老的例子上即可,范例积累越多,翻译起来越容易;
到了九十年代,随着机器运算能力的提高,产生了统计机器翻译,把源语言的字词翻译成出现次数最多的对应的目的语言字词,准确地极大的提高了;有字统计翻译,短语统计翻译,直到2016年,短语统计翻译还是各种翻译软件的主流;
最后,出现了深度学习神经网络翻译,语言中间件终于派上了用场,一个神经网络负责把句子编码为中间件,另一个神经网络负责从中间件里解码出目的语言。一种复发神经网络RNNs最适合做这个工作,现在RNNs被用在Siri语音识别,键盘输入联想提示,作曲和聊天机器人中。神经网络2年的工作超越以往的20年的翻译工作,将来不只是能实时文本翻译,而是可以实时语音翻译!
对机器翻译,深度学习有兴趣的同学一定请阅读这篇极其有意思的科普文章。