每日学习记录 2019-10-21

2019-10-21  本文已影响0人  hwang_zhic

2019-10-21

提出问题

探究 SRui 论文中的相似与非相似用户,相似项目与非相似项目,这 4 个关键内容是如何求出的。

解决问题

用户之间的相似度

用户之间的相似度是使用皮尔逊相关系数(PCC)来求得,具体定义如下:

s_{i f}=\frac{\sum_{k \in I(i) \cap I(f)}\left(r_{i k}-\bar{r}_{i}\right) \cdot\left(r_{f k}-\bar{r}_{f}\right)}{\sqrt{\sum_{k \in I(i) \cap I(f)}\left(r_{i k}-\bar{r}_{i}\right)^{2}} \cdot \sqrt{\sum_{k \in I(i) \cap I(f)}\left(r_{f k}-\bar{r}_{f}\right)^{2}}}

其中 I(i) 用户 i 对一组物品的评分,\bar{r}_{i} 代表用户 i ​的平均评分。从这个定义中,用户相似度 sis 的值范围为 [ -1 - 1] 。如果这个值越大,则表示用户 i 与 用户 f 相似。我们使用 f(x) = (x + 1) / 2来将用户的 PCC 的相似性范困限制到 [0:1]。

项目之间的相似度

项目之间的相似度的计算方法如下,也是皮尔逊相关系数(PCC)

s_{j q}=\frac{\sum_{k \in U(j) \cap U(q)}\left(r_{k j}-\bar{r}_{j}\right) \cdot\left(r_{k q}-\bar{r}_{q}\right)}{\sqrt{\sum_{k \in U(j) \cap U(q)}\left(r_{k j}-\bar{r}_{j}\right)^{2}} \cdot \sqrt{\sum_{k \in U(j) \cap U(q)}\left(r_{k q}-\bar{r}_{q}\right)^{2}}}

其中 U(j) 表示对项目 j 评分的一组用户,\bar{r}_{j} 代表项目 j 的平均分。

之后需要解决的问题

上一篇 下一篇

猜你喜欢

热点阅读