Spark-Meetup阅读笔记

2015-07-12  本文已影响148人  一只小青鸟

一、spark-meetup阅读笔记

1.显式矩阵分解(Explicit Matrix Factorization)

公式:$$min_{x,y}\sum_{u,i}(r_{u,i} - x{_u^T}y_i - b_u - b_i)^2 - λ(\sum_u|x_u|^2 + \sum_i|y_i|^2)$$

2.隐式矩阵分解

和显式矩阵不同的地方在于隐式矩阵的输入是用户的购买浏览等记录,隐式矩阵通常是稠密矩阵,而显式矩阵通常是稀疏矩阵。

公式:$$min_{x,y}\sum_{u,i}c_{u,i}(p_{u,i} - x{_u^T}y_i - b_u - b_i)^2 - λ(\sum_u|x_u|^2 + \sum_i|y_i|^2)$$

3.迭代逼近的方法

由于数据量大,随机梯度下降的方法不再适合,使用易于并行的交替最小二乘法来逐步迭代逼近。

4.算法输入输出

5.隐式矩阵分解的Hadoop扩展

6.隐式矩阵分解 in Spark

上一篇 下一篇

猜你喜欢

热点阅读