9-6

2017-09-06  本文已影响0人  汪之涛

背景:

某个论坛的帖子评论分成positive和negative两种,你已经拿到了sample(影评)和label(评价)两个集合,现在你想知道:

词汇 --- 评价

之间的关系,即情感倾向词汇。

这时候很容易想到的方法是:计算某个词汇的positive/negative的比例,就可以知道词汇的情感倾向,而不需要借助情感词典,假设:ratio = positive/negative,很明显ratio是一个以1为中心的评价指标,ratio=1可以将词汇看成中性词汇。如下图抽取影评结果:

around 1

而你会发现后期的计算尝尝要求指标以0为中心的,像这样:

around 0

这时候怎么办呢,答案就是对数变换!

上一篇下一篇

猜你喜欢

热点阅读