推荐系统设计要点 | AI-PM| 新年第一弹
2019-01-02 本文已影响1人
阿拉灯神丁Vicky
1
推荐系统组成
前台展示页面、后台日志系统、推荐算法;
通过前台页面与用户交互产生数据,将数据存储在后台日志系统,开发人员根据推荐算法对日志系统中的数据进行分析处理,生成推荐结果。
2
用户数据收集
用户属性数据:性别、年龄、学历等
用户行为数据:点击、收藏、购买等
用户结果数据:评论、反馈、邀请等
物品特征
标签
内容
属性
3
日志分析处理
日志系统分为两类,这里所说的为第一类:
一、面向用户收集
二、面向开发者收集
用户行为轨迹
跟踪分析问题
审计系统运行
4
推荐系统算法
推荐系统是连接前台页面和后端数据的桥梁。推荐系统的实质就是根据用户行为特征匹配物品特征的中间件。
推荐结果是基于用户数据与物品特征,在时间、多样性、流行度等不同维度根据用户需求赋予权重并进行筛选、排序等处理后的结果,当推荐系统生成初始结果,然后通过过滤、排名等算法生成最终推荐结果与理由。
整个过程遵循 用户 -> 特征 -> 物品 过程。
推荐引擎可抽象成一种特征,每种特征对应一种推荐策略,对应不同用户需求,变换对应特征上的权重,最终生成 物品 -(特征映射)> 用户 {item -> userfeature}。
5
推荐系统关键点
如何发现用户感兴趣的物品?
1、主动:用户自行选定关键词
2、被动:浏览记录、社交数据
如何确定物品之间的关系?
1、相似度原理:根据物品关键词或标签
2、系统过滤:基于用户或物品的同类圈子
6
如何实现精准分类
混合推荐:多种推荐策略融合达到一加一大于二的结果
隐语义模型:物品权重分类匹配
文本精准匹配:TF-IDF(一种常用于信息检索与数据挖掘的加权技术)
社交网络:用户关系数据,比如用户熟识度、兴趣相似度(互为好友、单向关注/收听、兴趣小组)
时间特征:物品的时效性(时间权重)
环境特征:用户LBS数据(所在地权重)