个性化推荐算法的四大策略02
简单推荐策略
在复杂的推荐系统中,推荐算法作为其最核心、最关键的部分,很大程度上决定了推荐系统性能的好坏,且重点体现在数据决策层。
在个性化推荐系统中,简单推荐策略主要分为:基于热门推荐推荐、基于基本信息推荐、基于内容推荐、基于关联规则推荐。
基于热门推荐
热门推荐,顾名思义就是使用统计的方法将最热门的物品进行推荐,越热门的物品被点击的可能性越大。
基于基本信息推荐
基于基本信息推荐是根据用户的基本信息如:领域、职位、工作年龄、性别和所在地等给用户推荐感兴趣或者相关的内容,比如年龄-关联电影表、收入-关联商品类型表,性别-文章关联表等等。
因为基于热门推荐与基于基本信息推荐使用比较简单,所以这两个推荐策略应用比较广泛。
基于内容推荐
基于内容推荐是指(Content Based Recommandation)利用用户和物品的相关信息,例如前述用户和物品画像信息及用户对物品的行为构建的模型,例如浏览、点击、打电话、收藏、评论、下单等。内容推荐算法根据用户行为推断用户偏好,并为用户推荐相同偏好的物品。
基于内容推荐的计算过程一般分为四个步骤:
- 找到用户历史感兴趣的物品集合
- 找到物品集合的具化属性
- 抽象具化属性的共性属性
由这些共性属性查找其他物品,并实施推荐。
基于关联规则推荐
基于关联规则推荐(Association Rules)是通过数据挖掘的方法找到物品之间的相关关系,再进行标签推荐,比如大家所熟知的“啤酒”和“尿布”,就是某超市工作人员通过对顾客的购物清单进行分析后,才发现了啤酒和尿布之间的共现关系。
而衡量物品之间的关联性时,主要看支持度、置信度和提升度这三大指标。
1)计算支持度
支持度表示 AB 共现情况占所有情况的比例,则有表达式 Support(A->B)=P(A&B),它往往用来评估搜索词当中该词出现的概率。
2)计算置信度
置信度表示 AB 共现情况占 A 情况的比例,其表达式为 Confidence(A->B)=P(A&B)/P(A)。
3)计算提升度
提升度表示以 A 为前提下 B 出现的情况与 B 情况的比例,表达式为 Lift(A->B)=P(B|A)/P(B) ,它往往用来评估推荐效果。
在计算 Lift(A->B) 时,主要出现以下三种情况:
Lift(A->B)>1 时,说明搜索 A 时推荐 B 比直接推荐 B 的效果更好
Lift(A->B)=1 时,说明搜索 A 和搜素 B 属于独立事件,二者没什么关系
Lift(A->B)<1 时,说明搜索 A 和搜索 B 负相关,搜索 A 还不如不去推荐 B。