豆瓣评分漏洞

2018-03-02 本文已影响0人游神ss

前一段豆瓣上出现了一部两分电影。导演很生气，说毁了他12年的心血。

没人同情他。

豆瓣评分五星制，五星就是十分，一星就是两分，这位的得分99%以上是一星。

人们相信豆瓣评分，不相信导演自评。这是对的。我上次去看评分的时候，有17022人打分。你相信17022人，还是相信一个人？

评分可以不只是评分，可以大得多。可以是对已发生事件的评价，比如给电影打分；可以是对将发生事件的预测，比如民意调查；也可以是决策的扳机，比如你得分超过某个阈值就采取相应行动。

评价、预测、决策，三位一体，来自对群体智慧的聚合。找到正确的聚合方法，你就找到了撬动群体智慧的杠杆，能够撬动一切。

而豆瓣聚合的方法，创始人阿北曾经自己解释过，原则上就是一人一票，简单平均。

简单归简单，这办法很靠谱。如果投票者数量足够多，投票相对独立，那么简单平均值的准确度会系统性地超越个体判断。

类似的实验已经做过无数次。把一头牛牵到集市，让赶集的农夫目测其体重。最后下来会发现，没有哪个农夫的判断，能够超过把所有农夫的判断加总再平均。

原因在于，每个人各自掌握一些信息，各有判断，哪怕只是用平均这样简单粗暴的方法聚合起来，也比单个人掌握的信息要完整，形成的判断更准确。这就是群体智慧的原意。

它已经足以战胜绝大多数有专家头衔的评委。

豆瓣的简单平均法简洁但远不完美。假设一部电影只有两个人打分五星，另一部电影一百万人打分平均4.9星。哪部电影更好？简单平均法识别不了。

这时候就需要另一种算法，贝叶斯推理。电影评价类网站的始祖和霸主IMDB用的就是这种算法，它能够解决极少数用户打极高分或者极低分的时候，对一部电影的评价出现不准确或不公平的问题。

在这一点上，它是一个比豆瓣更优化的评价机制。

那什么是贝叶斯推理呢？贝叶斯推理是一种更新既有判断的方法，有两个要点：首先你有一个既有判断；其次获得新信息，不断调整更新。

这么说有点抽象，其实我们每个人在生活中都在用，我来举个例子你就知道了。

比如，我第一次跟你见面，我不了解你，对你一无所知，但是我对人类有点了解。我先入为主的看法就是好人和坏人三七开，七分好三分坏。那我跟你打交道，我就假设你也是三七开，我们在一起聊了一个小时的天，我给你多打一分，就变成二八开了；我们共事的一年，我觉得你特别棒，就变成一九开了。

这就是我们用贝叶斯推理对人进行的评价和判断。那贝叶斯推理在IMDB电影评分机制上是怎样运用的呢？

贝叶斯推理总是从预先的假设开始。既然事先不知道一部电影得分会是多少，那就给它一个基准分，对应一个基准的投票数。IMDb给的基准分是网站上所有电影的平均分，比如6.5，对应基准的打分人数，比如是3000人。

不管是什么电影，在获得第一个用户打分之前，默认都是得6.5分，对应着3000张投票。

你看了电影，开始打分，新信息进来了。贝叶斯推理会用这些新信息修正得分，随着每个用户的打分变化。算法我就不列了。大体上是这样的情境：

如果只有一个用户打分，那么电影得分无限接近于网站平均分；如果有3000真实用户打分，跟基准数一样，那么得分正好是3000名真实用户实际打分，与网站平均分两个分值之间的平均分；如果打分用户数量极大，那么得分会极度逼近这些用户的实际打分。

一人一票足够好吗？

一人一票是平等的，但看电影这件事有许多好理由支持搞不平等：水军跟观众不应该平等，掏钱买票看的跟白看的不应该平等，高水平观众跟普通观众不应该平等。