Hadoop Page Rank

2017-11-04  本文已影响0人  98Future

Page Rank实现本质也是矩阵相乘

Idea: 用Transition Matrix 乘 initial population on each website. 得到的就是下一个state 的population on each website. 不断调用transition matrix, 最后各个网站人数会趋近stable。

unitState表示time of convergence 我们可以自己定。

调用multiplication.main() on Page Rank matrix.

然后再Sum on unitMultiplication Result.

Multiplication:

PRmapper 给的是当前state上的人数 pr[0] = web name, pr[1]=population

MultiplicationReducer=<网站B, 从网站A这次来B的人数>

//Sum

KEY IDEA:

从1去到a,b,c,d

每个占比1/4!

上一篇下一篇

猜你喜欢

热点阅读