理解TF - IDF

2018-06-15  本文已影响0人  ruihan_xia

Q1: TF - IDF的全称是什么,为什么是这个名字?
全称: 词频 - 逆文档频率(term frequency - inverse document frequency)
其中:

Q2:最终的排序机制是什么
TF - IDF = TF * IDF
得到权重,进行排序

Q3:优缺点是什么
优点 : 容易理解
缺点 : 对所有词一视同仁,一般来说,文末的词的权重更高,但是无法调整.

上一篇 下一篇

猜你喜欢

热点阅读