文章摘要的自动生成(2)textTank的应用
2018-11-21 本文已影响0人
文_飞
TextRank算法基于PageRank,用于为文本生成关键字和摘要。PageRank的原理已经在(1)里面总结了。
textRank的思路一样,只不过把网页替换成了文章中的词语。先用分词库对文章分词,每个单词作为pagerank中的一个节点。设定窗口大小为kk,假设一个句子依次由下面的单词组成:
w1,w2,w3,w4,w5,…,wn
最后分析出哪个词语的权重更大,然后分析出关键短语,再根据短语抽取出权重最大的句子。
具体分析看