7M推荐系统 - S0 推荐业务,Feed流产品及推荐算法策略架

2020-01-07  本文已影响0人  左心Chris

1 推荐业务

排序模型

召回分支

产品视角

飘红点击率高10%
竖版(快手)比横版(头条)点击率高10%
一般基本有5个tab,但是微信只有4个tab
rerank根据产品和运营需求,比如强插美女视频,比如横版为竖版

推荐系统评估与实践

2 特征方法

item特征

item的类别和统计类特征
量纲和平滑
离散和连续特征和相互转化

用户特征

用户画像库和标签
U2I特征(某个userid买了多少itemid),交叉特征(主要是id交叉)

数据的存储和使用

使用支持Map-Reduce的数据库进行存储比如hive,使用Mapper和Reducer
如果id都在一起的话,使用均匀哈希分桶和数据倾斜

Embedding

one-hot representation 01
distributed representation 聚类

特征工程

简单模型+复杂特征
复杂模型+简单特征

上一篇 下一篇

猜你喜欢

热点阅读