Character-level Convolutional Ne

2018-02-28  本文已影响0人  小绿叶mj

文中指出,在大规模数据集上(尤其是书写不规范的ugc),cnn文本分类问题在char-level同样有很好的效果。
文中alphabet总共有70个char:


alphabet

模型包括6层卷积3层全连接,前两层fc使用了0.5的dropout。


char-cnn

每层细节如下表所示:


输入部分截断到长度为1014,不在alphabet中的词向量置0。

数据增强:近义词替换

评估:


Evaluation
上一篇下一篇

猜你喜欢

热点阅读