鬼谷研究院博弈论我的必修课

说一些绝大多数人不知道的逻辑、博弈论和偏见--《牛奶可乐经济学2

2016-03-27  本文已影响1231人  鲜虾云吞

注意:这不是读书笔记,我不会讲很多书本身的内容,只会说些我认为有意思的亮点,和我个人的思考。所以建议先大致看完全书再看,那样效果会比较好。

我喜欢做读书笔记,我喜欢把书嚼碎了吸收了,再用自己重新整理一遍的思路,让别人更加快速简单地get到那些概念。这是我的一种特异功能。

不过我不喜欢原原本本地复述作者的意图,那样太机械和单调了。


不过还是大致讲下这书吧。

牛奶1以通俗易懂讲经济学而闻名,冲着这个去看牛奶2的人恐怕要有点失望了。

牛奶2全书分两部分,前半部分讲个体的消费者行为学,后半部分讲群体组织行为学。如果前半本讲还能勉强算通俗,后半段看着就有种看我的微观经济学课本的意味了...公式 图表 生僻不好理解的名词一大堆,我实在不觉得他哪里通俗了。我并不觉得经济学复杂到不能让人快速理解,从这点上觉得作者的续作有点点水份?

Anyway, 这书对于入门经济学还是不错的。


说回正题,说一些我觉得这本书很亮,很有意思的地方!

第一个我觉得很亮的地方是跟博弈论有关的。

先说我为什么觉得他亮:这其中似乎蕴含了一种逻辑,一种用来构成改善社群人群组成的规则的逻辑。通俗的说就是,一条让社会中好人更多,坏人更少的规律。

在提到信息经济学时,作者讲了一点博弈论。其中有个跟囚徒困境很像的,他叫鹰鸽博弈,就是鹰和鸽子之间的生存斗争。

具体可以看下图:

重点看红色框部分

我画了两个博弈表格,上面是鹰鸽博弈,下面是囚徒困境,1234代表的是,利益最大的1234位。1利益最大,4最小。作者没有具体分析这两个博弈,但是我看着越看越有兴趣就自己研究了起来。大家先记住那两个表。觉得不习惯的可以把数字换掉。如果有一点博弈论基础的话,理解起来会比较快。

“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑两年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。

传统的囚徒困境,是单次博弈,博弈结果纳什均衡下保持稳定,大家都会选择背叛,尽管大家一起合作才是最优选择。(所谓纳什均衡就是各自达到最优选择策略,而且没有动机去更换策略的一种稳定状态,具体可查百科、知乎)而一旦扩展到多次博弈,就会出现另一种情况。这里照顾一下不懂博弈论的朋友,简单说下“以牙还牙”策略。

当大家要不停地玩囚徒困境这个游戏的时候,如果你一直选择“背叛”,大家自然就会讨厌你。如果你一味合作,大家就会欺负你。怎么解决呢?其中最优的一种策略就是“以牙还牙”。如果两个囚徒之间存在不确定次数的多次博弈,那么如果互相背叛,显然不是最好的。以牙还牙策略,意思是说玩家在第一轮选择合作,在第二轮之后的策略,选择复制对方的上一轮策略。

比如第一轮你选合作,对方背叛你,那么第二回合你就复制对方上轮的背叛,背叛对方。如果对方是个一直合作的人,你也会一直合作。如果对方是坏蛋,不断背叛你,那么你也跟他死磕。如果对方突然回心转意,你也会宽恕对方。这个策略厉害在于有这三种功能:与好人合作,与坏人对抗,宽容。实际上我觉得这更像一种为人处事的哲学...

好的,我相信有博弈论基础的朋友肯定早早就知道这两个概念了。不过第二种鹰鸽博弈对大家可能会有点陌生。鹰鸽博弈,其实是把生物学上自然选择的内容套进博弈论了。假设草原上只有鹰和鸽子两种生物。如果两只鹰碰上了,会打架,各自获得最差的4利益。如果两只鸽子碰上了,和平分食物,各自获得第2好的。如果鹰碰上了鸽子,鹰抢了鸽子的食物,鹰获得1,鸽子获得3。

大家发现没有,这两种博弈非常相像!鹰鸽博弈同样是多次博弈,但是情况跟囚徒困境完全不同!

囚徒博弈

在单次囚徒困境中,背叛者的整体收益(加权后),总是比合作策略要高。所以大家都选择背叛,所以才有了囚徒困境这种情况。

鹰鸽博弈

但是在鹰鸽博弈中,两种策略的数量比例,却会存在一个均衡点!而决定这个均衡点的,是鹰和鸽子的比例。如果鸽子很多,那么鹰大概率碰到鸽子,鹰经常能获得第1高的收益。这种情况下,做鹰是最优选择。如果鹰很多,鹰总是碰到鹰,只能获得最差的4,那么做鸽子又是最好的选择。所以最后,鹰和鸽子的数量最终会稳定在一个均衡点上。当其中任意一方的数量超过了这个比例,就会受到上述两种力量的抑制重新回到均衡点。

我想到的第一个点是...其实大自然就是这样来控制各个生物种族的数量的吧...

我想到的第二个点就是,如果我把鹰看成背叛者和坏人,把鸽子看成合作者和好人,把草原换成人类社会的话,这种情况是不是还是存在呢?坏人和好人之间存在一个均衡点?我觉得是很可能有的...

那么我再更进一步,是不是可以通过改变某些条件,使得均衡点往好人那边靠,提高整个社会中好人的比例呢?

我发现问题的关键点就是,囚徒困境和鹰鸽博弈两者的区别。其实就是3跟4的位置不一样。如果可以改变3和4,就能改变均衡点。翻译过来,让好人更多坏人更少的方法有两个:

一个是,增大背叛者之间互相背叛的损失;

另一个是,当背叛者遭遇合作者时,减轻合作者的伤害。

也可以说是,增加坏人互相遭遇的损失;减轻坏人害好人时好人的损失;同时,使得前者的损失大于后者。我们会想到通过规则约束犯罪行为,其实就是在减轻好人的损失。第一个我还没想到怎么套用在社会上。

不过通过这个,可以从另一个角度看美苏冷战。

我们经常认为,美苏冷战时期,核武器的互相威慑,是一种囚徒困境,实际上这是不对的,这更像是一种鹰鸽博弈。如果苏联发射了核弹,美国不发射,就是苏联1,美国3;如果美国发射了,苏联美国都是4。其实这应该是鹰鸽博弈...在我追查相关博弈论的论文的时候,发现了一些论文支持这个说法。据说是在信息不明朗的时候,博弈树的形态也会改变...最终等同于单次博弈。论文的最后结论也是,其实美苏之间的冷战注定是不会爆发的。

这个是关于...博弈论这块的亮点。

牛奶2书中我觉得有意思的第二个亮点,是三种偏见。

其实这三种偏见应该是归属到怪诞行为学的。怪诞行为学我看了,但是新出来了这3种偏见我在怪诞1里面没看过,不知道怪诞2会不会有,总之觉得很有意思。

第一个偏见叫做可用性偏见。意思是人们经常根据记忆调用的方便程度,去估计事件的概率。比如如果问人们,R开头的单词多,还是R排第三位的单词多,很多人会选1。不过那只是因为1情况给人留下的记忆最深刻。另一个例子是,如果问纽约的谋杀案多还是自杀案多,很多人会选谋杀案,其实是因为谋杀案给人造成的印象更深刻。

而这个记忆深刻与否...有三个因素决定。书中分别说是,能够调动人的情绪的;重复的;和最近发生的。我发现这其实就是人的记忆基本规律,符合这三个特征的事情,人就能够记牢。这跟我之前看过的一些记忆法的规律基本是共通的。

第二个跟第三个偏见,都属于代表性偏见。其中第二个偏见说的是,人们经常用特质的吻合程度来判断概率。

比如说,在其他条件不变时,我们看到一个害羞的人,然后二选一判断他是一个图书管理员还是一个销售员,我们往往会觉得他更像图书管理员,但是这是不对的!

真正决定我们判断的,应该是图书管理员跟销售员的绝对数量。可能有90%的图书管理员害羞,相对的,只有1%的销售员害羞。但是一个国家里,销售员的数量,远远超出图书管理员几个数量级!这就意味着害羞的销售员的数量,要远大于害羞的图书管理员。所以那个人更可能是销售员!

书中只说到这。但是我发现另外一个问题:这是否意味着这种福尔摩斯式的推理是不对的呢?类似通过某个人的特征来推断某个人的职业?或者他去过什么地方?于是我花了好几个图想了好久,最终答案是....这两者并不矛盾。

通过一个人害羞,判断他是图书管理员,这本身是有问题的。那是因为,这是一种从特殊到一般的,反过来的推理。是从结论倒推原因。我们可以说,一个图书管理员因为职业和环境的问题,容易造成性格害羞。所以图书管理员会跟害羞形成强相关关系,但是这种强相关,是单向的。因为除了图书管理员,还有很多职业的人也会害羞,图书管理员只是其中一小部分。所以通过害羞倒推出职业是不妥的。

既然如此,那为什么福尔摩斯式推理能够成功呢?

那是因为福尔摩斯从来不会仅通过一个线索去得出结论,而这往往是很多推理爱好者犯的错误...一看到耸肩、眼睛乱瞄、脚抖,就立刻说对方在说谎,就是这种错误的典型示范。用一个线索去得出结论是很不准确的。但是福尔摩斯式推理的关键在于,当你发现了2个,3个,4个线索同时指向目标的时候,可能性的圈子就会越来越小,最后准确率就会接近100%了。

这真的是名副其实的那句话的含义:当你排除了所有不可能的选项,剩下的无论再怎么难以置信,那就是真相!一个害羞的人是图书管理员的概率很低。但是一个又喜欢看书,又害羞,上衣还夹着一个图书管理员证件的人,是图书管理员的概率就会非常非常的高!

这就是解决这个谬论的答案。

最后一个我觉得有意思的偏见,也属于代表性偏见,叫做“回归效应”。

比如,如果我们从人群中抽选100人做IQ测试,其中会有大概5%的人的有120以上的智商。但是人做测试的这种行为,结果是会存在浮动的。也就意味着,有些人是因为恰好运气好,表现出色,才过了120的线。如果给这5%的人再做一次IQ测试,会有相当的人不能通过这个120的线。这个就是回归效应。

好玩的地方在于....比如某个球员的表现很出色,然后媒体都会大量关注。然后这个球员新秀往往表现就会很差,达不到人们的预期,然后媒体又很失望。这个就是回归效应。

如果一个员工工作绩效很好,老板表扬了他。但那只是偶然,第二次绩效考核员工表现不好,老板就骂。越骂越差,然后员工又变好了。这会给老板一种错觉,以为表扬员工反而会让员工骄傲而表现得更差,而骂员工反而能起到激励效果。

我觉得这个也很有意思。如果能排除这个偏见的话,对自己对他人都会更加宽容和客观吧。

上一篇下一篇

猜你喜欢

热点阅读