文本情感分类

2019-12-30  本文已影响0人  dreampai

传统模型——基于情感词典

文本预处理

使用正则表达式,过滤掉我们不需要的信息(如 Html 标签等)

句子自动分词

载入情感词典

文本情感分类

优化点

深度学习模型

标准模型

算法步骤

分词 OR 不分词

“端到端”的模型:能够直接将原始数据和标签输入,然后让模型自己完成一切过程——包括特征的提取、模型的学习。

更好的更新方案

设定一个阈值为0.6,那么模型对某个正样本的输出大于0.6,我就不根据这个样本来更新模型了,模型对某个负样本的输出小于0.4,我也不根据这个样本来更新模型了,只有在0.4~0.6之间的,才让模型更新,这时候模型会更“集中精力”去关心那些“模凌两可”的样本,从而使得分类效果更好

修正的交叉熵损失

上一篇 下一篇

猜你喜欢

热点阅读