推荐中的频次控制
在业务场景中,我们不时会碰到需要频次控制的场景,典型的Case如:
C端消费的角度
- 品类密集,运动频道一屏都是NBA的内容;
- 低质密集,视频列表里接连不断的推荐出点击导向的三俗内容;
B端供给的角度
- 基尼系数偏大,在很多平台都会发生单点过热,出现了如一两个大V把持了流量的情况。
在上述的场景下,不论是出于用户体验的考虑,还是出于平台生态管控的角度,我们都需要引入对于特定对象的频次控制,牺牲全局的单一效率目标去做多目标的平衡。
为什么要牺牲全局效率目标?
在自然选择的过程中一定会出现强者和弱者:强者依靠自己的优势地位获取更多的资源,扩张到投入产出比的边界;而弱者,要么被淘汰,要么找到一个垂类领域生存。这一自然选择的现象,本身是无可厚非的。但是,在系统的角度,由于我们代入了上帝视角拥有了金手指,就往往使得这一过程发生了扭曲:就像银行贷款往往更倾向于以低成本放贷给不需要贷款的大企业,而不是真正需要贷款的小企业一样,推荐系统同样倾向于把流量曝光资源进一步倾斜给到强者而非弱者,从而造成了各种密集:品类密集、低质密集、大V密集等等。
在短期的角度来看,这一选择无可厚非:用户就是喜欢看特定类型的内容,大V的内容就是欢迎。而从中期的角度来看,这一选择实质上是在透支平台的可能性,蕴含了雪崩的风险:我们过度偏好了用户的某一个显性偏好,而没有花足够精力去探索其他隐性的偏好,当用户偏好发现变化的时候,我们往往无法及时承接用户偏好的变化,从而导致了用户的流失;我们让大V在平台上获得了过多的廉价流量,短期固然会带来数据指标的繁荣,长线上来看一方面可能抑制了小V的生存空间和生长可能,另一方面也往往出现客大欺店,增加管理成本的情况。在快手上屡屡发生的大V叫板平台,就是鲜活的例证。
![](https://img.haomeiwen.com/i52841/3aa247a1b39d0445.jpeg)
所以,在平台增长有空间的时候、发展有余力的时候,我们通常建议牺牲一些全局的效率指标,通过关注多元指标的方式,让迭代目标复合化。类似于发展GDP的同时关注碳排放和污染控制,我们在发展交易规模的时候也需要同时关注公平性指标、拒绝性负向指标。在收获快速增长的消费规模时候,一定要清醒区分这个指标数据的构成:是少数人带来了大量消费,还是每个人都有一定的消费;少数人的大量消费是可持续的、还是透支自身未来的,亦或是透支平台其他参与者利益的。
一个可执行的指标,在一定时间维度里大概率是一个单一指标,目标聚焦才好集中发力;但是在拉长时间轴去看,如果持续闷头狂奔,必然会带来结果的扭曲。我们需要通过在不同时间节点下调整自己的主要目标,才能够实现整个系统的均衡、有序发展。
如何做频次控制?
如何从曝光角度做资源的频次控制?我们可以分别从B、C的角度入手进行调控。
从C端的角度看,有三个维度:
- 全局频次控制,保证某种内容在全局的曝光里,将占比控制在阈值以下。这也通常是研发最喜欢使用的维度,直接设置一个Boost系数,就能够极大的缓解问题。
- 个体频次控制,基础的精细化调整。尽管我们控制了全局的频次,但是仍然可能在个体身上碰到雪崩。比如,我们在全局控制了NBA的内容,但是对于一个更偏爱NBA内容的用户,列表里仍然会都是同一类型的内容,所以,要限定一个个体的推荐列表里的内容上限。
- 个体体感控制,是进一步的精细化调整。因为用户在刷列表的角度会有时序上的体感,如一屏内出现的内容、接连三四条出现的内容。这时,我们就可以进一步的在一屏内进行打散,以不要让用户产生体感上的密集。
从B端的角度看,也可以进一步引入阶梯状的调权:
- 将B端的曝光设定不同的阈值,每当进入一个新的阈值后,就会进行相应的调权,从而控制基尼系数。(类似个税的等级调控机制)。
- 从更大生态的角度来思考,在保证平台交易规模一定程度损失的前提下,将流量更倾向于腰部、而非绝对头部,既能够让腰部有所生长,又能够使他们更依赖于平台。
控制频次,是我们对通过对资源的再分配,以实现对平台生态的干预。只有在干预之前更明确自己要用全局效率指标换来什么样的新指标,才能够更好的平衡整个过程中的取舍。