UGC社区推荐系统的几点思考
是否有推荐黑名单
最开始做推荐系统时,我认为既然给每位用户都是其个性化的推荐,那么就不应该有官方控制的推荐黑名单。推荐黑名单的作用是控制某个人或某篇文章不会被推荐给任何人。如果文章违规,应该直接锁定下线。毕竟官方控制的黑名单代表官方的喜好,官方不喜欢怎么能代表用户不喜欢呢?
有这样的认知,出于我认为算法自有其“价值观”;每个算法都有其目标函数,这个目标函数就可以被认为是算法的价值观。当然,这个价值观也是人为注入的。官方控制推荐黑名单是控制舆论,是一种“独裁”的体现。
但是,很快就意识到我是错的。世界不是非黑即白,有非常大的空间是灰色的,映射到推荐系统也是这样。有些文章与作者,即使数据再好,也不应该被分发,虽然文章并没有违规。这就是“不锁定,不推荐”,是平台价值观与意志最强的体现。
太湖湖畔-公司设计师拍摄协同过滤推荐算法适用于 UGC 社区吗
如果 User 和 Item 的行为矩阵极为稀疏,协同过滤不能很好的挖掘用户的兴趣偏好。而大多数 UGC 社区的用户行为矩阵都是非常稀疏的。
协同过滤无法解决冷启动问题,对于物品冷启动,要求有一些数据后,才能分发给更多的人。在 UGC 社区中,很多文章还没等热起来就已经凉凉了。
但并不是说 UGC 社区就无法使用协同过滤了,而是应该综合其他推荐算法一起使用,协同过滤主要提供新颖的内容,避免越推越窄的情况。
推荐系统在不同平台的极限
不同产品根据自己的定位首先有一个指标上的极限,这些指标包括 MAU、使用时长、刷帖量等。
比如,抖音都已经要上线防沉迷系统了,可见其用户使用时长有多恐怖,争夺“国民总时长”的战争非常激烈。
为什么抖音能这么风靡?
每个人每天大脑能消耗的能量是有限的,我们可以称之为心智能量。所有需要大脑参与的活动都需要消耗心智能量。用户看一个视频消耗的心智能量是很小的,几乎不需要大脑参与。刷到美丽小姐姐跳舞,我会睁大眼睛;刷到主播撩拨笑点,我会咧嘴一笑;我需要做的就只是动动尊贵的手指,上翻、下翻、双击。全程几乎只需要下丘脑参与。
可是,阅读就不一样了。我要找个安静舒服的地方,全神贯注地理解文字背后作者想表达的意思,需要调动大量的脑神经元。如果是140字的短微博,或者知乎上抖机灵的回答,阅读起来还能一乐。如果是有复杂的辩证论述,或抽象概念的文章,读完一篇,明显感觉有些累。要消耗这么大的心智能量,我一天的阅读极限是五篇这样的文章,还是全网份额。那简书平台人均每天阅读量是多少呢?
那么,推荐系统的极限就是帮助平台无限逼近平台的极限。
但是,文字比视频有更高的抽象层次,人类从没什么大不了的一种生物,到现在成为世界的主宰,区别就在于人类有抽象与想象的能力。也就是说好的文字通常比视频含有更高密度的信息量。
推荐系统要听党指挥
鉴于最后成文时,正值内涵段子被永久下线,头条 CEO 张一鸣发表道歉信:
‘四个意识’淡薄、社会主义核心价值观教育缺失、舆论导向存在偏差。一直以来,我们过分强调技术的作用,却没有意识到,技术必须要用社会主义核心价值观来引导,传播正能量,符合时代要求,尊重公序良俗。
这份好像来自远古时代语言体系的道歉信让人错愕。推荐系统有内在的算法,可是领导头脑中也有他们的算法,两个算法的目标函数是完全不同的。
但最终的结果肯定是党指挥算法,算法要提高自己的政治觉悟,听党指挥,忠于人民,时刻践行社会主义核心价值观。