推荐系统杂谈-推荐后台管理系统
前言:
毕业半年,在一家电商公司从事推荐的产品工作。上班的这半年从对推荐系统的了解只有“亚马逊上面的看了该商品的用户还看了”和“淘宝上面的猜你喜欢”之外一无所知的菜鸟,到如今的略懂。感觉是时候写一写东西,整理一下自己的思路。
推荐系统经过这么多年的发展,已经是一个很完善的系统。本系列文章会从推荐系统的后台管理系统,推荐系统的前端展示及交互设计,推荐系统如何跟业务需求场景结合,以及对目前主流的推荐算法综述这几方面来介绍一下推荐系统的全貌。由于本人刚参加工作不久,也不是科班出身,更是第一次尝试写这一类的博客。所以有什么写的不好或者不准确的地方,欢迎读者和同行进行指正,本人万分感谢。
正文:
本篇文章作为该系列的第一篇文章,主要介绍一下推荐系统的后台管理系统。以本人接触到后台系统的为样本,向大家介绍一下推荐后台管理系统必须具备的一些功能。首先给大家看一张推荐后台的功能体系概览图:
一般的推荐后台管理系统会涉及一下几个基本功能:①推荐效果数据②推荐算法管理③分析工具。下面我就分模块的介绍一下
一、推荐效果数据
彼得德鲁克有一句名言:“如果你无法衡量它,那么你就无法改进它”。这句话用在推荐系统真的是再适合不过,推荐系统是一个典型的数据驱动型的产品。在这一前提下,所有有关于推荐系统的决策都需要以数据作为依据。在推荐效果数据功能下又分为(1)关键指标数据功能(2)推荐系统性能数据
(1)关键数据指标功能
a.展位层次
关键数据指标功能是指,对于一个推荐的展位,对于考核该展位效果的指标数据,比如在电商行业中最关心的CVR,CVR、千次展示GMV以及其他关键指标。通过检测这些指标,可以很清晰的知道哪一些展位对于公司的利润贡献是最大的。在关键指标的基础上,加上时间维度,就可以清晰的检测到某一具体展位在本时间区间之内的关键指标的变化情况,直接反馈了这段时间内工程师们对该展位下算法的优化是否是有效的(排除促销等外部因素干扰),如果是有效的,提升的幅度有多少;如果是不利的,就可以针对行的进行排查优化。
b.策略层次
上面介绍的是关于对于展位级的数据的检测,但是在推荐系统中,经常会进行A/B测试,也就是在同一个展位下部署多个不同的策略,通过分流来比较策略之间的效果好坏,这个时候就不能单单对这个展位进行数据的监测,而是应该将监测的粒度细化到展位下策略的维度,通过对同一展位下多个策略,比较他们在统一口径下的指标效果,这样就可以很直观的判断出该展位下多个策略的优劣。这一数据也直接地为策略的上下线以及流量的切分比例提供强有力的决策依据。同样的,对于策略层级的数据监测也应该提供展示时间区间内变化趋势的功能。
(2)性能方面
目前,推荐系统是很少作为一个独立的产品出现的,主要是结合其他的业务形态,比如新闻,视频,音乐,商品等。所以推荐系统基本上在数据流上面是会进行跨部门的传输,这个时候就需要对推荐系统的数据流的各个环节进行监控。包括各个接口的响应时间,响应率,超时率,整体服务的性能效率分布情况等。这些对于研发工程师及架构工程师有着很大的参考意义,一般而言推荐系统的响应时间基本上决定于最慢的那一个接口的相应时间,这是典型的木桶短板效应。通过性能的监控可以帮助研发工程定位问题的范围,进而针对性的优化推荐系统的瓶颈。
二、算法管理
(1)算法的测试与发布
算法工程师在开发算法的过程中,有时候需要在测试环境中模拟一下线上的情况,并以此不断的优化算法。但是由于通常的数据库都是命令行的展现效果,没能很好的模拟展示线上的效果,所以需要开发一个供算法工程师模拟线上效果的可视化的环境,便于测试。
(2)算法A/B测试管理
该功能与上文提到的展位下多策略部署功能是一致的。对于某一展位,可能有多个策略,这个时候就需要后台管理系统提供一个可供配置的功能,以便于我们在展位下部署新策略和对策略进行流量权重的调整。
三、展位管理
(1)展位算法接入
如上文所说,推荐系统本身不能独立存在,一般是结合具体的业务形态出现的。那么在业务方出现新的需求或者在原有的业务基础上挖掘出新的展位时,我们就需要通过管理系统新增一个推荐展位,并为其配备相应的推荐算法。在配置时需要设置该推荐展位的位置,终端属性,等其他必须的缺省属性。这个受到不同业务形态的影响,所以各个公司应该都有不同的配置项。
(2)展位前端效果设置
对于推荐系统最终的效果的影响因素,知乎有人评论道:60%取决于UI效果,30%取决于数据处理,只有10%取决于算法。虽然不能确定这个说法是否正确,但是由此可见前端UI对于推荐效果有着举足轻重的影响。所以后台管理系统应该支持对于前端展位样式的选择和配置,这一方面,淘宝可以说是做的比较好的,如下图:
淘宝为首页的推荐展位设计了多种的展示模板,包括推荐槽位的大小,个数,样式都进行了设置。业务方可以根据自己的需求进行个性化配置。并且淘宝支持业务人工干预,即该模块支持推荐数据/运营数据的人工培植。
四、分析工具
上文说了这么多关于后天管理系统的功能,有面向业务人员,有面向算法人员,有面向研发人员,但是分析人员呢?所以分析工具就是面向分析人员的功能
(1)时间趋势,同环比
分析工具中的报表功能,支持在某一时间区间内,对某一展位的某一关键指标进行展示,由此精细化的分析推荐效果变化趋势,当然也支持双指标和多指标的同时检测。由于分析人员使用该功能的目的是进行分析报告的制作,所以支持图表下载功能也是必须的。
(2)推荐效果分布情况
这一功能主要是对于由推荐系统创造的业务收入的分布情况,在电商行业可能就是品类的分布情况,在新闻资讯行业可能就是新闻频道的分布情况,在视频行业可能就是视频类型的分布等等。这一功能的主要目的是预测该行业下细分项目的流行趋势。为排行版等场景提供支持。
总结
以上就是接触推荐后台的半年来的大致了解,当然只是一个很肤浅的解读。算是一个推荐系统入门者对于整个推荐系统中一个小版块的解读吧。文中凡有撰写不当及表述不清楚的地方,欢迎各位读者提出指正,再次先谢谢大家。个性化推荐是时代的趋势,相信推荐系统也会有一个美好的明天吧。最后附上个人的微信号二维码,欢迎有兴趣一起探讨关于个性化推荐领域的小伙伴骚扰~