统计机器翻译中的几篇经典文献

2017-08-20 本文已影响38人 x00c

MIT人工智能实验室的《如何做研究》建议阅读本领域中最本质的几篇论文：“如果你对AI的某个子领域感兴趣，向该领域的高年级研究生请教本领域最重要的十篇论文是什么”。阅读经典论文，对于了解感兴趣的领域非常重要。而关于统计机器翻译，最经典的几篇论文又是什么呢？

A Statistical Approach to Machine Translation　　简称Brown90，这是统计机器翻译的奠基之作，是了解统计机器翻译基本思想的必读，文章中最主要的思想是把机器翻译看成是一个信息传输的过程，用一种信源信道模型对机器翻译进行解释。另外文章主要是对统计机器翻译三部分（翻译模型、语言模型及解码）的宏观介绍，涉及的数学理论并没有过多的详细解释，因此读来比较轻松。
The Mathematics of Machine Translation: Parameter Estimation　　简称Brown93，主要针对Brown90中翻译模型的参数估计进行了详细的数学解释，需要一定的数学基础和耐心，不过Kevin Knight 99年JHU（约翰霍普金斯大学）夏季机器翻译研讨班上的《A Statistical MT Tutorial Workbook》对Brown93用例子及通俗的方式进行了讲解，读来比较容易理解，值得对照阅读。
Discriminative Training and Maximum Entropy Models for Statistical Machine Translation　　这是统计机器翻译领域中传奇人物Franz Josef Och 在2002年ACL会议上发表的论文，他提出了基于最大熵模型的统计机器翻译方法，是对Brown信源信道模型的极大扩展，开阔了统计机器翻译的视野，并为研究者提供了一个融合其它知识到统计机器翻译中的研究框架，这篇论文获得了当年的ACL最佳论文奖。
Statistical Phrase-Based Translation　　这是统计机器翻译领域另一个大牛Philipp Koehn 2003年与Och合著的文章，已涉及了具体的方法而不是理论框架：基于短语的统计机器翻译。之所以选在这里，与Koehn 2004年发布的具有广泛影响力的解码器Pharaoh不无关系，Pharoah现在已被Koehn领导的另一个开源项目Moses所取代。
BLEU: A Method for Automatic Evaluation of Machine Translation　　这是目前用得最广的机器翻译自动评测方法BLEU的原始论文，之所以选在这里，因为评测方法的好坏对于机器翻译的研究具有很大的影响，BLEU理应作为评测方法的代表入选。
　　统计机器翻译中其实还有好多经典文献，恕本人学识有限，这里只将自己能力范围之内的重要文章放在这里，欢迎大家探讨和补充！这些文章都可以在Google中搜到，所以这里就不附下载连接了。

转载:“我爱自然语言处理”：www.52nlp.cn 2008年12月25日

统计机器翻译中的几篇经典文献

猜你喜欢

热点阅读