网络之家程序员机器学习与数据挖掘

Facebook开源的机器翻译框架-号称比Google更准且快9

2017-11-25  本文已影响101人  AlexTuring

五月份的时候,Facebook发布了Fairseq机器翻译模型,号称比基于RNN的模型训练速度提升了九倍,而且翻译质量更高,经过实测,速度和翻译质量也确实有可观的提升,基于pytorch实现的版本也于不久前开源,学习笔记如下:

一、概览

二、模型结构

总结:

Fairseq真的是个神奇的模型,其应用在英中语对上比之前的最好的模型都要好不少,尤其是其pytorch版的模型相较于初始Lua版模型在训练速度和显存占用上又有不小的改进,但这并不是神经网络翻译的极限,在英中上我们一定程度上修改了一下模型,并尝试这添加了几个trick,感觉还相较于官方的模型,仍会有超过1个BLEU值的提升,并且其与LSTM模型ensemble后会有更大的提升,以此可以认为CNN和RNN在机器翻译领域有某种程度的互补作用。
最后,向Facebook这家在天朝并不存在的公司为机器翻译做出的巨大贡献致敬!

上一篇 下一篇

猜你喜欢

热点阅读