自然语言处理 (让机器更懂你)大数据,机器学习,人工智能机器学习与数据挖掘

TF-IDF——关键词提取

2019-04-22  本文已影响1人  dreampai

TF-IDF 算法

注意事项

算法优化

考虑每个词的词性

在文本中,名词作为一种定义现实实体的词,带来更多的关键信息,如在关键词提取过程中,对名词赋予更高的权重,能使提取出来的关键词更合理。

考虑出现的位置

在某些场景中,文本的起始段落、末尾段落比起其他部分的文本更重要,如果对出现在这些位置的词赋予更高的权重,也能提高关键词的提取效果。

上一篇 下一篇

猜你喜欢

热点阅读