用户画像及推荐算法入门
2020-03-15 本文已影响0人
你值得拥有更好的12138
用户画像初探
个人笔记分享,如有错误请指出
数据运营的三个阶段
-
探索期
在这个阶段,更多是通过一些简单的版本更迭和新功能的上线后,查看基础的用户数据。比如上线了一个圈子的功能,用户的日活跃有没有上去,使用时长有没有增加
-
成熟期
当来到这个阶段后,数据颗粒度会更加的小。比如涉及到每一个用户的行为,给每一个用户画像。进而调整产品的用户人群,或者调整产品的界面功能等。
-
变现期
当上一个阶段的用户画像积累一段时间后,产品需要一个变现的手段。这时候就需要基于用户画像去推荐广告,推荐内容等
用户画像的基本流程

1.首先我们需要确定画像的类型,基于统计还是算法或者两者皆可
2.进行用户标签的规划
- 静态标签---位置,性别等
- 动态标签 ---行为所产生:喜欢的频道,使用时间段
- 预测标签---可能会喜欢的相关内容等
3.标签的提取
4.标签的处理(图中还缺用户统一识别,用户不一定使用同一个设备,需要合并不同设备,历史和现在的标签)
- spark graphx
5.标签的使用测试
业务流程

用户标签举例
下图为视频网站的标签举例

用户行为(动态)标签设计

属性标签就按一般的er图的思想就可以。

用户标签权重打分
用户标签权重 = 行为类型权重 × 时间衰减 × 用户行为次数 × TF-IDF计算标签权重
推荐算法分类

基于spark ALS 协同过滤算法流程

基于用户和视频标签相似度算法流程

关键词的提取和查找同义词
python jieba.analyse工具包
python synonyms 工具包