文本风格迁移泛读系列(一)—— Style Transforme

2019-06-19  本文已影响0人  DataArk

一、写在前面的话

这篇论文涉及文本风格迁移领域,其主要思路是放弃了常规风格迁移需要先编码出style variable 和 style-independent content vector的思路,直接在输入句子和style variable进行风格迁移,其中style variable由另一个网络控制,该网络通过几个任务来保证style variable是合理的,整体的思路其实类似对抗网络。另外,该论文在生成迁移风格的文本时,选用了Transformer。

二、论文笔记

下图是论文网络的整体架构,其主要由Transformer Network和Discriminator Network两部分构成,Transformer Network部分比较简单,就是一个端对端的生成结构

Discriminator Network则通过以下几个任务限制和对抗:

三、结果

论文通过两个Automatic Evaluation和Human Evaluation:

3.1 Automatic Evaluation

3.2 Human Evaluation

3.3 生成结果

总体来说,我个人非常喜欢这篇论文的思路,由于风格迁移缺乏平行预料,所以,使用对抗网络的方式引入损失从而进行训练,这样大大降低了模型对于平行预料的依赖。

上一篇 下一篇

猜你喜欢

热点阅读