机器学习-吴恩达9(2)-推荐系统

2019-12-08 本文已影响0人皮皮大

推荐系统 Recommender Systems

问题形式化

推荐系统应用的十分广泛：如果你考虑网站像亚马逊，或网飞公司或易趣，或iTunes Genius，有很多的网站或系统试图推荐新产品给用户。如，亚马逊推荐新书给你，网飞公司试图推荐新电影给你，等等。这些推荐系统，根据浏览你过去买过什么书，或过去评价过什么电影来判断。这些系统会带来很大一部分收入，比如为亚马逊和像网飞这样的公司。因此，对推荐系统性能的改善，将对这些企业的有实质性和直接的影响。

通过一个栗子来了解推荐系统

假使我们是一个电影供应商，我们有 5 部电影和 4 个用户，我们要求用户为电影打分

QaTZY4.png

前三部是爱情片，后面两部是动作片。Alice和Bob更倾向于爱情片，Carol和Dave更倾向于动作片。一些标记

$n_u$ 用户的数量
$n_m$ 电影的数量
$r(i,j)$ 如果用户j给电影i评过份则 $r(i,j)=1$
$y^{(i,j)}$ 代表的是用户j给电影i的评分
$m_j$ 表示的是用户j评过分的电影总数

基于内容的推荐系统Content Based Recommendations

在一个基于内容的推荐系统算法中，我们假设对于我们希望推荐的东西有一些数据，这些数据是有关这些东西的特征。现在假设电影有两个特征：

$x_1$ 浪漫程度
$x_2$ 动作程度

Qa7nUS.png

那么每部电影都有一个特征向量，如第一部电影的是[0,9 0]

针对特征来构建一个推荐系统算法。假设使用的是线性回归模型，针对每个用户使用该模型， $\theta^{(1)}$ 表示的是第一个用户的模型的参数。定义如下：

$\theta^{(j)}$ 第 $j$ 个用户的参数向量
$x^{(i)}$ 电影的 $i$ 的特征向量

针对电影 $i$ 和用户 $j$ ，预测评分标准
$(\theta^{(j)})^Tx^{(i)}$
代价函数可以表示为（针对用户j）：误差平方和+正则化项
$\min_{\theta(j)}\frac{1}{2}\sum_{i:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)}) + \frac {\lambda}{2}(\theta^{(j)}_k)^2$
其中 $i:r(i,j)$ 表示只计算用户 $j$ 评过分的电影。针对所有用户的代价函数求和：
$\min_{\theta(1),...,\theta^{(n_u)}}\frac{1}{2}\sum^{n_u}_{j=1}\sum_{i:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)}) ^2+ \frac {\lambda}{2}\sum^{n_u}_{j=1}\sum^n_{k=1}(\theta^{(j)}_k)^2$
使用梯度下降法求出最优解，更新参数 $\theta^{(j)}_{(k)}$
$\theta^{(j)}_{(k)} := \theta^{(j)}_{(k)} - \alpha\sum_{i:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})x^{(i)}_k ; k=0$

$\theta^{(j)}_{(k)} := \theta^{(j)}_{(k)} - \alpha(\sum_{i:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})x^{(i)}_k+\lambda\theta^{(j)}_k) ; k\neq0$

协同过滤Collaborative Filtering

上面基于内容的过滤算法是通过电影的特征，使用特征来训练出每个用户的参数。相反，如果使用用户的参数，也可以学习得出电影的特征：
$\min_{x(1),...,x^{(n_m)}}\frac{1}{2}\sum^{n_m}_{i=1}\sum_{j:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)}) ^2+ \frac {\lambda}{2}\sum^{n_m}_{i=1}\sum^n_{k=1}(x^{(j)}_k)^2$
如果没有用户的参数和电影的特征，协同过滤算法便可以同时学习这两者。
$J(x^{(1)},...x^{(n)},\theta^{(1),...,\theta^{(n_u)}}) = \frac{1}{2}\sum_{i,j:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)}) ^2+\frac {\lambda}{2}\sum^{n_m}_{i=1}\sum^n_{k=1}(x^{(j)}_k)^2+\frac {\lambda}{2}\sum^{n_u}_{j=1}\sum^n_{k=1}(\theta^{(j)}_k)^2$