《模型思维》03:你只管努力,剩下的放心交给时间
最近,一首名为《漠河舞厅》的歌在短视频网站和各大音乐平台火了。这首根据现实爱情故事编创的歌曲,触动了网友们的神经:“在速食主义盛行的年代,老一辈的爱情愈加令人动容。”
image.jpeg这首歌并不是最近创作出来的,而是在2020年。
你是否也会有一样的疑问,为什么这首歌明明很好听,当时怎么就火不起来呢?因为是去年的歌,时间跨度不大,我们也很难用社会价值观、对音乐的审美发生变化这种理由来解释。
其实这种现象在其他领域也很常见,像有些书籍明明就很好看,但销量就是惨淡。
如果你去问《模型思维》的作者斯科特·佩奇,他会说,他们不是败给自己,也不是败给市场,而是败给了科学。
1. 幂律分布
相信大家都听过这么一个词“马太效应”,这个效应说的是强者愈强弱者越弱之现象, 也就是说我们只要获得了每一点的成功,就会产生积累优势,使之拥有更大的机会获得更卓越的成就。就像滚雪球一样,越滚越大。
“马太效应”可以用一个公式曲线来解释——幂律分布,也被叫做长尾分布或重尾分布。
image.png如果一个事件符合幂律分布,那它会有两个特性需要我们去关注:
1、事件的概率与其大小成反比,事件越大,发生的可能性越小,也就是该事件只有少数几个大“赢家”(大崩溃、大地震、大火灾和严重的交通拥堵)和很多的“输家”。
2、大事件虽然也很少见,它们发生的频率却足以引起我们的注意。
可能有的同学会发现这幂律分布和我们上次说的“正太分布”有相似之处,都是大事件发生的概率非常小。然而我们对待这些大事件却是完全不同的态度。
根据数据统计,恐怖袭击所造成的死亡人数的分布是遵循幂律分布的,且指数为2,概率为百万分之一的恐怖袭击事件是一个差不多有800人死亡的事件。而如果由于恐怖袭击造成的死亡人数是一个均值为20、标准差为5的正态分布,那么概率为百万分之一的事件将只会导致不到50人死亡。
所以啊,如果一个事件符合幂律分布,虽然大事件很少见,它们发生的频率也要引起我们高度重视。
除此之外,幂律分布还要求非独立性,比如当某个人买了一本《哈利·波特》后,其他人也可能跟着买;当一棵树着火时,火势会蔓延到邻近的树木;当一个城市的人口增加时,这个城市的基础设施会随之改善,工作机会也会随之增加,从而对其他人更具吸引力。
幂律分布除了能够解释马太效应,它还能如何帮助我们理解这个世界呢?
这里我们再列举幂律分布的3个应用:齐普夫定律、优先连接模型、自组织临界模型。
2. 齐普夫定律
齐普夫定律是美国学者G.K.齐普夫于20世纪40年代提出的“词频分布定律”。它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。若用f表示频次,r表示等级序号,则有fr=C(C为常数)。人们称该式为齐普夫定律。
所以,如果一个幂律分布事件指数等于2,那么它等级排列序号乘以它的大小等于常数,即:事件等级×事件大小=常数。
同样,城市人口分布也大体符合齐普夫定律。
image.png除此之外,下列数据同样符合齐普夫定律
-
网页访问频率
-
收入前3%的人的收入
-
地震震级
-
固体破碎时的碎片大小
3. 优先连接模型
优先连接模型能够解释城市规模、图书销量和网络链接等。
它描述的场景是这样的:有一连串物体(人)一个接一个地到达。第一个到达者创建一个实体。后续每次有人到达时都应用以下规则:在概率p(较小)的情况下,新到达者创造一个新的实体;在概率(1-p)的情况下,新到达者加入现有的某个实体。加入某个特定实体的概率等于该实体的大小除以到目前为止所有到达者的数量。
image.png你看,大学里面的社团就是优先连接模型的典型代表。
第一个来到学校的学生创建了一个新的社团,第二个到达的学生以较小的概率创建了自己的社团,更有可能的是,他会加入第一个学生创建的社团。前10个到达的学生可能会创建3个社团:一个有7个成员,一个有两个成员,一个有一个成员。第11个到达的学生只会以极小的概率创建第4个社团,如果不创建新的社团,她就加入现有的社团。如果这样做,那么她有70%的可能性加入已有7个学生的社团,有20%的可能性加入已有两个学生的社团,只有10%的可能性加入只有一个学生的社团。
同样地,优先连接模型解释了为什么网络链接、城市规模、企业规模、图书销量和学术引用数量同样是赢者通吃。
4. 自组织临界模型
自组织临界是指一个由大量个体组成的系统在输入的驱动下自组织达到临界态。这个系统不需要通过调节参数来逼近临界点,而是需要一个持续的外界输入。
举个例子,假设有这么一片森岭,它最初只是一个空的N×N网格。每过一个周期就在网格上随机选择一个格点。如果该格点为空,那么就以概率g在那里种上一棵树。如果该格点上已经有树,那么闪电会以概率(1-g)击中该格点。如果该格点有一棵树,那么树会着火,火势会蔓延到所有连接到该格点的有树的格点。
image.jpeg当种树的速度接近1时,树木的密度会增加到一个临界状态:在这个相对茂密的森林中,被闪电击中有可能摧毁很大一片森林。在这种临界状态下,森林中斑块大小的分布,以及火灾大小的分布,都满足幂律分布。此外,森林还会自然而然地趋向这种密度水平。如果密度较低,密度会增加(因为被雷击中概率小)。如果密度超过了阈值,那么任何火灾都会毁掉整个森林。因此,树木可以自组织地达到了一个临界状态。
所以,我们不能一味的为保护树木而谴责砍树人,砍树对整个森林来说也是一种保护。
5. 写在最后
《漠河舞厅》并没有像其他“输家”一样沉沦,而是一夜爆红被大众所熟知,这次“小事件”的逆袭也揭示了信息时代正在不断对幂律分布的发起冲击。
以前我们听到一首好歌,要分享给其他人靠的是口口相传,很难给幂律分布带来影响,而现在一个短视频就能够让一个“小事件”被成千上万人所知晓而成为“大事件”。
你看,信息时代的发展提高了这个社会的公平性,只要你有实力,就不会被埋没,你要做的就是不断学习提高自己,剩下的可以放心交给时间,终有一天会成功,相信这一天会很快到来。