用户画像

推荐资料汇总与解说

2018-12-12  本文已影响186人  VentLam

最近和好几位朋友讨论推荐系统的搭建和升级,暂时没空将全部实践过的部分都写出来,但是看过的资料和论文倒是一气呵成地梳理出来,对想从零搭建一个推荐系统或者对推荐系统现有效果不满希望升级的同学来说,可能有用,也可能没用,你都已经看过。

1. 架构部分

  1. 头条首席架构师曹欢欢的分享,为了让业界了解头条的算法,比较清晰扼要,突出重点,没有讲最新的内容。但是核心都涉及到,值得反复研读。基本上绝大部分推荐系统架构和头条一致。当中的差异主要体现在实时框架上,头条继承百度系的搜索架构思想,喜欢用倒排索引来实现很多部件。阿里、腾讯更加倾向于类似于Strom的流式计算加上KV存储的方式。个人认为并无高低之分,看架构师、负责人喜好和团队技能分布。
    36氪首发 | 今日头条推荐算法原理全文详解
    今日头条成功的核心技术秘诀是什么?深度解密个性化资讯推荐技术

  2. 爱奇艺的推荐架构演化,有整体架构、算法模型的升级进化过程,从算法产品的角度来讲述不同的算法模型演化和效果过程,是一个值得follow的演化路径。可能在爱奇艺的数据上,这些模型的效果如此好。实际上,在大量其他公司的实践和paper,可能同样的算法模型不一定做的出来一样的效果。
    爱奇艺个性化推荐排序实践

  3. 业界解读youtube推荐算法模型,这篇文章值得去看的是,如何设计观测指标,如何评估内容。
    从YouTube算法论文反推其推荐机制

    如何破解YouTube视频推荐算法?

  4. 饿了么的推荐架构,包含一部分LBS的领域知识,整体架构也比较清晰。推进的路径也不错,EE的应用也重视的很好。
    回顾·外卖推荐算法中有哪些机制与手段?

  1. 糖豆的实践,第一期比较稚嫩,但是0到1是gain最大的时候,极少人力就能快速上线,建立良好的评估基线极其重要。包括了实时、深度学习、强化学习等内容,有些零散,但是比较直接面对具体的一个推荐系统阶段。上述的文章一般不会这么详细。
    糖豆推荐系统第一期开发与评估报告
    糖豆实时推荐系统设计与实现
    单步强化学习在糖豆推荐系统的应用
    深度学习于糖豆推荐应用--图片模糊识别
    第二期后续的工作我一直没空写,以后有空写一下,大概包括算法演进、语义挖掘、用户画像、深度学习的尝试等。

2. 模型部分

2.1 基础的推荐模型

包括基于流行度基于协同过滤基于内容等模型。
这些模型都比较简单却非常有效,一般作为候选集的选择或者粗排去使用或者推荐系统初期模型,这些都是非CTR预估模型。
Collaborative Filtering based Recommendation Systems exemplified
Beginners Guide to learn about Content Based Recommender Engines


2.2 LR及其推广模型


2.3 基于隐变量的模型

FM的改进版本包括FFM等等,都在百度、美团等公司的广告、推荐等系统广泛使用。


2.4 Tree-based ensemble模型


2.5 基于深度学习的模型

3. 其他部分

可以看到推荐系统不是一个简单的工程,涉及到内容、产品策略、客户端、服务端、大数据、推荐工程、推荐算法、评估体系等等一系列,这些组件环环相扣,存在大量变量和组合,也有漫长的迭代周期,相信每个公司在实践过程中有大量的独特的体验和收获。过去的关于所有这些推荐系统的建设经验局限于时间和工作因素,没有全部都写完, 以下还有补充两个部分,抛砖引玉 。

• AB测试平台是线上评估的必须。
https://www.jianshu.com/p/2fcdd25d3499

• 大数据的埋点非常重要,准备好最充分的数据原材料
https://www.jianshu.com/p/d45235b51601

本来还有实验部分、评估部分、实战内容,但是我当时比较困了,就不想写了。

上一篇 下一篇

猜你喜欢

热点阅读