用户画像及推荐算法入门

2020-03-15  本文已影响0人  你值得拥有更好的12138

用户画像初探

个人笔记分享,如有错误请指出

数据运营的三个阶段

用户画像的基本流程

image.png

1.首先我们需要确定画像的类型,基于统计还是算法或者两者皆可

2.进行用户标签的规划

  - 静态标签---位置,性别等
  - 动态标签 ---行为所产生:喜欢的频道,使用时间段
  - 预测标签---可能会喜欢的相关内容等

3.标签的提取

4.标签的处理(图中还缺用户统一识别,用户不一定使用同一个设备,需要合并不同设备,历史和现在的标签)

5.标签的使用测试

业务流程

image-20200315001107138.png

用户标签举例

下图为视频网站的标签举例


image.png

用户行为(动态)标签设计

image.png

属性标签就按一般的er图的思想就可以。


图是盗的

用户标签权重打分

用户标签权重 = 行为类型权重 × 时间衰减 × 用户行为次数 × TF-IDF计算标签权重

推荐算法分类

image.png
基于spark ALS 协同过滤算法流程
image.png
基于用户和视频标签相似度算法流程
image.png

关键词的提取和查找同义词

python jieba.analyse工具包

python synonyms 工具包

上一篇 下一篇

猜你喜欢

热点阅读