玩转大数据机器学习与数据挖掘Python语言与信息数据获取和机器学习

5 分钟入门神秘的推荐机制

2017-02-04  本文已影响349人  暄颜

在这个极度信息爆炸的时代,人们有了更为广阔的信息获取渠道,但是却发现要获取到实际感兴趣的内容越来越困难。传统的搜索引擎已经满足不了用户高效获取信息的需求。推荐机制成长迅速,与搜索一起,成为了用户获取信息的最主要的方式之一。

我最近在做几个与推荐有关的项目,工作需要,关于推荐机制也现学了一些皮毛,期待与你一起学习成长。

推荐机制,简单来说,就是依据一定的算法,把内容推荐给可能对它感兴趣的用户的一种技术,这里的「内容」可以是文章,可以是商品,可以是职位,可以是广告,可以是视频,也可以是人。

先用一张导图来概括整篇文章的内容:

推荐机制要顺利运转,缺不了两个东西,一个是数据(内容和用户),一个是算法(规则)。

先来说说数据。

推荐机制需要的数据包括内容和用户。但内容和用户在实际情况下是相当复杂的,必须要将它们二者有价值的东西抽象出来。对于推荐机制,通过「标签」来了解内容,通过「属性和行为」来认识用户。内容详尽的标签数据,用户详实的属性数据和丰富的行为数据,是推荐机制运作的基础。

再来说说算法。

比较基本的推荐算法有三种:基于内容的推荐算法,基于用户属性的推荐算法和协同过滤推荐算法。

1.基于内容的推荐算法

这种算法是根据内容的标签,比如主题啦,类型啦,关键词啦等等,将标签相似的内容归为一类,把这类内容推荐给可能有偏好(浏览过,收藏过,点过赞,购买过,评价过等)的用户。

以新闻资讯类产品为例,画个图如下方便理解:

用户小红经常浏览有关娱乐明星的新闻,小明经常看体育比赛新闻,那就把最新的娱乐八卦新闻推荐给小红,把体育类最新资讯推荐给小明。

2.基于用户属性的推荐算法

这种算法根据用户的属性,比如性别啦,年龄啦,所在城市啦等等,将属性相似的用户归为一类,给这类用户推荐相同的内容。

以视频类产品为例,画个图方便理解:

24 岁的姑娘小红看了《疯狂动物城》并给了好评,27 岁的小伙小明看了《荒野猎人》给了好评,那就可以把《疯狂动物城》推荐给 23 岁的女性小花,把 《荒野猎人》推荐给 30 岁的男性小刚。

3.协同过滤推荐算法

根据重点关注的数据不同,这种算法一般分为基于用户的协同过滤算法和基于内容的协同过滤算法。

基于用户的协同过滤算法:根据用户的历史行为偏好,把具有相同偏好的用户归为一类用户群,把这个用户群中一些用户喜欢的内容推荐给这个群体中的其他用户

以电商类产品为例,画个图方便理解:

小红的购物车里收藏了好多件连帽套头卫衣,印花棒球服和韩版宽松毛衣,小花近期也收藏了好多件连帽卫衣和印花棒球服,鉴于小红和小花都喜欢连帽卫衣和印花棒球服,她们可能拥有相同的偏好,那可以把小红喜欢的韩版宽松毛衣也推荐给小花。

基于内容的协同过滤算法:根据用户的历史行为偏好,把多数用户同时喜欢的内容归为一类内容群,把这个内容群中的一些内容推荐给对这个内容群中其他内容感兴趣的用户。

以求职类产品为例,画个图方便理解:

小红应聘了杭州某互联网公司的行政岗位,小花和小明也应聘了该公司的行政岗同时还应聘了客服岗,通过小花和小明的偏好,可以推测出这两个岗位要求很相似,那就把这家公司的客服岗也推荐给小红。

推荐机制的算法有好多,这些只是一些比较基本的,根据产品特性和业务场景的不同,要使用的推荐算法也不一样,比如一些新上线的产品,由于缺乏足够的用户属性和行为数据,只有内容数据,会使用基于内容的推荐算法; 一些 UGC 类社区的产品,由于内容不可控,却对用户属性和行为很了解,会使用基于用户属性的推荐算法或基于用户的协同过滤算法;再比如招聘类产品,由于内容(公司)的数量远远小于用户(求职者)的数量,对内容的把控会更加稳定和精准,会使用基于内容的协同过滤算法。

说了这么多,你有没有一点点头晕晕啊啊啊,来做个思考题,说不定会更晕的。看下图,微信使用了哪一种推荐算法?

上一篇下一篇

猜你喜欢

热点阅读