链接分析算法总结

2018-06-19  本文已影响0人  Asian_Road
  1. 两个模型
  1. 链接分析算法的关系图


    链接分析算法.png
  1. PageRank
    网页通过链接关系构建起Web图,在初始阶段,每个页面设置相同的PageRank值,通过若干轮的计算,获得每个页面的最终PageRank值。
    终止点、采集器陷阱:抽税方法

    迭代计算公式: 计算.png
    快速计算:MapReduce
  2. HITS
    定义导航页和权威页,在扩展网页集合内计算每个网页的导航度和权威度。

    一个网页的导航度正比于其所有链出网页的权威度之和;一个网页的权威度正比于其所有链入网页导航度之和。 导航和权威度的计算
  3. SALSA算法
    得到扩展网络集合,将网页集合转换为一个二分图,一个子集合是Hub子集,另一个是Authority集合;然后采用链接关系传播权值,类似PageRank。

  4. 主题敏感PageRank
    对网页引入主题相关PageRank分值;查询相关

  5. Hilltop算法
    非从属组织页面;专家页面
    过程:专家页面子集合->查询->相关专家页面->目标页面子集合->搜索结果

上一篇 下一篇

猜你喜欢

热点阅读