文章摘要的自动生成(2)textTank的应用

2018-11-21  本文已影响0人  文_飞

TextRank算法基于PageRank,用于为文本生成关键字和摘要。PageRank的原理已经在(1)里面总结了。

textRank的思路一样,只不过把网页替换成了文章中的词语。先用分词库对文章分词,每个单词作为pagerank中的一个节点。设定窗口大小为kk,假设一个句子依次由下面的单词组成:

w1,w2,w3,w4,w5,…,wn

最后分析出哪个词语的权重更大,然后分析出关键短语,再根据短语抽取出权重最大的句子。

具体分析看

使用TextRank算法为文本生成关键字和摘要

上一篇下一篇

猜你喜欢

热点阅读