文本风格迁移泛读系列（一）—— Style Transforme

2019-06-19 本文已影响0人 DataArk

一、写在前面的话

这篇论文涉及文本风格迁移领域，其主要思路是放弃了常规风格迁移需要先编码出style variable 和 style-independent content vector的思路，直接在输入句子和style variable进行风格迁移，其中style variable由另一个网络控制，该网络通过几个任务来保证style variable是合理的，整体的思路其实类似对抗网络。另外，该论文在生成迁移风格的文本时，选用了Transformer。

二、论文笔记

下图是论文网络的整体架构，其主要由Transformer Network和Discriminator Network两部分构成，Transformer Network部分比较简单，就是一个端对端的生成结构

Discriminator Network则通过以下几个任务限制和对抗：

三、结果

论文通过两个Automatic Evaluation和Human Evaluation：

3.1 Automatic Evaluation

(Style Control) fastText classifier
(Content Preservation) BLEU score
(Fluency) 5-gram KenLM

3.2 Human Evaluation

3.3 生成结果

总体来说，我个人非常喜欢这篇论文的思路，由于风格迁移缺乏平行预料，所以，使用对抗网络的方式引入损失从而进行训练，这样大大降低了模型对于平行预料的依赖。

上一篇下一篇

猜你喜欢

热点阅读