首页投稿(暂停使用,暂停投稿)简书电影简书电影院

豆瓣评分漏洞

2018-03-02  本文已影响0人  游神ss

前一段豆瓣上出现了一部两分电影。导演很生气,说毁了他12年的心血。

没人同情他。

豆瓣评分五星制,五星就是十分,一星就是两分,这位的得分99%以上是一星。

人们相信豆瓣评分,不相信导演自评。这是对的。我上次去看评分的时候,有17022人打分。你相信17022人,还是相信一个人?

评分可以不只是评分,可以大得多。可以是对已发生事件的评价,比如给电影打分;可以是对将发生事件的预测,比如民意调查;也可以是决策的扳机,比如你得分超过某个阈值就采取相应行动。

评价、预测、决策,三位一体,来自对群体智慧的聚合。找到正确的聚合方法,你就找到了撬动群体智慧的杠杆,能够撬动一切。

        而豆瓣聚合的方法,创始人阿北曾经自己解释过,原则上就是一人一票,简单平均。

简单归简单,这办法很靠谱。如果投票者数量足够多,投票相对独立,那么简单平均值的准确度会系统性地超越个体判断。

类似的实验已经做过无数次。把一头牛牵到集市,让赶集的农夫目测其体重。最后下来会发现,没有哪个农夫的判断,能够超过把所有农夫的判断加总再平均。

原因在于,每个人各自掌握一些信息,各有判断,哪怕只是用平均这样简单粗暴的方法聚合起来,也比单个人掌握的信息要完整,形成的判断更准确。这就是群体智慧的原意。

它已经足以战胜绝大多数有专家头衔的评委。

      豆瓣的简单平均法简洁但远不完美。假设一部电影只有两个人打分五星,另一部电影一百万人打分平均4.9星。哪部电影更好?简单平均法识别不了。

这时候就需要另一种算法,贝叶斯推理。电影评价类网站的始祖和霸主IMDB用的就是这种算法,它能够解决极少数用户打极高分或者极低分的时候,对一部电影的评价出现不准确或不公平的问题。

在这一点上,它是一个比豆瓣更优化的评价机制。

那什么是贝叶斯推理呢?贝叶斯推理是一种更新既有判断的方法,有两个要点:  首先你有一个既有判断;其次获得新信息,不断调整更新。

这么说有点抽象,其实我们每个人在生活中都在用,我来举个例子你就知道了。

比如,我第一次跟你见面,我不了解你,对你一无所知,但是我对人类有点了解。我先入为主的看法就是好人和坏人三七开,七分好三分坏。那我跟你打交道,我就假设你也是三七开,我们在一起聊了一个小时的天,我给你多打一分,就变成二八开了;我们共事的一年,我觉得你特别棒,就变成一九开了。

这就是我们用贝叶斯推理对人进行的评价和判断。那贝叶斯推理在IMDB电影评分机制上是怎样运用的呢?

贝叶斯推理总是从预先的假设开始。既然事先不知道一部电影得分会是多少,那就给它一个基准分,对应一个基准的投票数。IMDb给的基准分是网站上所有电影的平均分,比如6.5,对应基准的打分人数,比如是3000人。

不管是什么电影,在获得第一个用户打分之前,默认都是得6.5分,对应着3000张投票。

你看了电影,开始打分,新信息进来了。贝叶斯推理会用这些新信息修正得分,随着每个用户的打分变化。算法我就不列了。大体上是这样的情境:

如果只有一个用户打分,那么电影得分无限接近于网站平均分;如果有3000真实用户打分,跟基准数一样,那么得分正好是3000名真实用户实际打分,与网站平均分两个分值之间的平均分;如果打分用户数量极大,那么得分会极度逼近这些用户的实际打分。

一人一票足够好吗?

一人一票是平等的,但看电影这件事有许多好理由支持搞不平等:水军跟观众不应该平等,掏钱买票看的跟白看的不应该平等,高水平观众跟普通观众不应该平等。

上一篇 下一篇

猜你喜欢

热点阅读