推荐系统实践-char1

2020-09-19  本文已影响0人  皮皮大

RS in Action-one

最近看下推荐系统的入门书籍《推荐系统实践》,\color{red}{项亮老师}的这本书应该是国内推荐系统中最受好评的。虽然有电子版,但是对于比较经典的书籍,还是会买纸质版的。

第一章主要介绍的是什么是RS系统、RS系统的分类、RS系统的应用、RS系统的评测指标等

image

思维导图

image

什么是推荐系统

如何买花生米

上面的例子中用户是有明确地需求:买花生米。如果用户周六想看一部电影,面对电影网站上万部的电影,该如何抉择?用户会手足无措,不知道该看哪部电影

在互联网快速发展的时代,人们从信息匮乏的时代步入了一个信息过载的时代,信息量过大从而导致无法确定选择。

如果有一个自动化的工具,分析用户的历史兴趣,从庞大的电影库中找到几部符合用户习惯和口味的电影供其选择,就完美了,不用自己去抉择。

这个工具就是个性化推荐系统,解决信息过载问题

image

解决信息过载

解决信息过载的两个方法:

搜索引擎需要用户提供关键词来寻找信息;推荐系统不需要用户提供明确的需求,通过分析用户的历史行为给用户的历史行为建模,从而主动给他们推荐满足他们需求的信息。

物品长尾

主流商品满足绝大部分用户的需求,而长尾商品往往代表了一小部分用户的个性化需求。推荐系统通过发掘用户的行为,找到用户的个性化需求,从而将长尾商品准确地推荐给需要它的用户。

推荐方式

  1. 社会化推荐

  2. 基于内容的推荐

  3. 基于协同过滤的推荐

推荐算法的本质:通过一定的方式将用户和物品联系起来,而不同的推荐系统利用了不同的推荐方式

image

RS应用

RS组成

RS应用

电子商务

个性化推荐系统之王:<svg xmlns:xlink="http://www.w3.org/1999/xlink" width="5.245ex" height="3.033ex" viewBox="0 -887.4 2258.3 1306.1" role="img" focusable="false" style="vertical-align: -0.972ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g fill="bule" stroke="bule"><g fill="bule" stroke="bule"><g fill="bule" stroke="bule"><g fill="bule" stroke="bule"><g fill="bule" stroke="bule"><text font-family="STIXGeneral,'Arial Unicode MS',serif" stroke="none" transform="scale(52.083) matrix(1 0 0 -1 0 0)">亚</text></g></g></g><g fill="bule" stroke="bule" transform="translate(752,0)"><g fill="bule" stroke="bule"><g fill="bule" stroke="bule"><text font-family="STIXGeneral,'Arial Unicode MS',serif" stroke="none" transform="scale(52.083) matrix(1 0 0 -1 0 0)">马</text></g></g></g><g fill="bule" stroke="bule" transform="translate(1505,0)"><g fill="bule" stroke="bule"><g fill="bule" stroke="bule"><text font-family="STIXGeneral,'Arial Unicode MS',serif" stroke="none" transform="scale(52.083) matrix(1 0 0 -1 0 0)">逊</text></g></g></g></g></g></g></svg>​,下图是亚马逊的个性化推荐列表

image

亚马逊的三种推荐方式:

  1. 基于物品的推荐算法:给用户推荐那些和他们之前喜欢的物品相似的物品

  2. 基于好友的个性化推荐:Facebook好友

  3. 相关推荐列表:打包销售

电影和视频网站
个性化音乐网络电台
image
社交网络

最为成功的是Facebook。最为重要的两个数据:

  1. 用户之间的网络关系:人与人之间

  2. 用户的偏好信息:个体信息

提供的API接口:Instant Personalization

image

开发EdgeRank算法对用户的每次会话(分享和评论)进行排序

个性化阅读
基于位置的服务
image
个性化邮件

第一个个性化邮件推荐系统:Tapestry。通过分析用户阅读邮件的历史行为和习惯来对新邮件进行排序,提高用户的工作效率。采用的是基于协同过滤筛选信息。

个性化广告

个性化广告投放技术分为3种:

  1. 上下文广告

  2. 搜索广告

  3. 个性化展示广告

RS系统评测

RS系统之3个组成

image-20200913163723268

RS系统实验方法

主要是有3种方法来评测推荐系统效果的实验方法:

离线实验

重要的组成步骤

  1. 通过日子系统获得用户行为数据,按照一定的格式生成一个标准的数据集

  2. 将数据库按照一定的规则分成训练集和测试集

  3. 在训练集上训练用户兴趣模型,在测试集上进行预测

  4. 通过事先定义的离线指标来评估效果

离线方法的优缺点

image
用户调查

离线指标和实际的商业指标之间存在差距。一般的,高预测准确率不等于高用户满意度

很多离线时没有办法评测的与用户主观感受有关的指标都可以通过用户调查获得。用户调查的过程中需要注意的2点:

在线实验

在完成离线实验和必要的用户调查后,可以将推荐系统上线做AB测试。AB测试是常用的在线评估算法的实验方法:

优点 缺点
公平地获得不同算法实际在线时的性能指标</br>包含商业上的指标 周期长,必须进行长期的实验才能获得可靠的结果

做AB测试的时候注意切分流量

image

评测指标

用户满意度

主要是通过问卷调查的方式来获得

预测准确度

最重要的推荐系统离线评测指标

上一篇 下一篇

猜你喜欢

热点阅读