万维钢 精英日课

博弈论5:装好人的好处

2019-02-24  本文已影响17人  b4c3eecc1b51

博弈论假设参与者都是理性的人,学习博弈论我们学习的也是理性的决策。理性人的一切行动都是为了自己的利益。但是另一方面,妈妈告诉我们要做个好人。那你说理性的人,还有可能是好人吗?

有的人认为我们生活的这个世界是由弱肉强食的丛林法则主导的,好人都很愚蠢。也有的人在任何情况下都选择做好人。那博弈论是怎么看待好人的呢?

1.好人与囚徒困境

以前有个电视节目是这样的 [1]。两个人组队答题,题目都很简单,答对一些题之后两人会获得一笔奖金,有好几千美元。节目的最大看点是怎么分这笔钱。规则是每人在一张纸条上写下“朋友”或者“敌人”这两个词中的一个。如果两人写的都是“朋友”,就平分这笔钱。如果一个人写“朋友”一个人写“敌人”,那么写“敌人”的人就拿走所有的钱,写“朋友”的人什么都得不到。如果两个人写的都是敌人,那就是谁也得不到。

这是一个典型的囚徒困境,而且博弈只发生一次。写“敌人”,要么你就拿到所有的钱,要么你就一分钱都拿不到。写“朋友”,要么你就一分钱都拿不到,要么你只能得到一半儿的钱。对吧?显然两个人的压倒性策略都是写“敌人”。

然而节目中的真实情况是53.7%的女性和47.5%的男性都选择了合作,他们写下了“朋友”。

这些人在金钱面前选择了相信一个素昧平生的人。他们宁可被人背叛也不愿背叛别人。他们选择了做好人。类似这样的研究我见过好多个,甚至有经济学家还专门跑到监狱里去,让真正的囚徒玩了囚徒困境的游戏 [2]。这些研究的结果高度一致:有一半儿、甚至一半儿以上的人选择做好人。

难道这些人都是非理性的吗?

一个解释是这些人的确有点非理性了,因为他们玩这种游戏都还不够熟练。我们说了,人在做熟悉的事情的时候通常是相当理性的。比如有实验证明 [1,3],如果让一群人连续跟不同的对手玩过几把囚徒困境游戏,他们的行为就会趋于理性,会更多地选择背叛。这就好像在社会中见识了人性之恶,会把人变得成熟一样。

但有意思的是,如果让固定的两个人连续玩比如说100把囚徒困境游戏,他们会大量地合作,一直到最后几轮才开始互相背叛。

这似乎容易理解,我们在熟人面前总是做好人。但是,简单的博弈论分析并不支持这个做法!这个现象,曾经是一个著名的悖论。

2.好人与有限次重复博弈

上一讲我们说,重复博弈会促进合作,因为你可以惩罚那些不合作的人。但是请注意,上一讲说的重复博弈,其实有个隐含的假设,那就是重复次数是无限的。在有限次的重复博弈中,按理说,你还是不应该合作。

这个结论有点怪,但是逻辑很清楚。比如两个人总共要进行100次囚徒困境博弈。咱们先考虑最后一次博弈。这时候因为后面就没有惩罚的机会了,双方的压倒性策略都是背叛。对吧?

好,那既然如此,第99次博弈的时候你会怎么做?双方都已经算出来了下次对方肯定背叛,那这次还能合作吗?所以第99次博弈必定也是互相背叛。

那同样道理,第98次博弈也应该是互相背叛。……有限次重复博弈中的每一次博弈都应该是互相背叛才对。

可是实验中为什么不是这样呢?两个人直到最后阶段才背叛,前面是连续的合作。是因为他们不会计算吗?对此,我至少听到过两个解释。

一个解释 [3] 认为,真实生活中的博弈次数的确是有限的,但是也是随机的 —— 如果我们不知道互相还会有几次博弈,甚至不知道下次还会不会有博弈,那么为了避免将来*可能的*惩罚,这次还是应该选择合作。正所谓“做人留一线,日后好相见。”

还有一种解释 [4] 认为,就算我们明确知道未来还会有多少次博弈,理性选择也应该是先合作。这个理论是1982年才被四个经济学家提出来的,叫“四人帮模型” [5],非常有意思,事关要不要做好人这个重大问题。

“四人帮模型”这个解释的关键在于,对方到底是不是个理性的人,这个信息是*不完全*的,这叫做“不完全信息博弈”。如果双方都明确知道对方是理性的人,那有限次重复博弈就不会有合作。可是社会上有些人就愿意当好人,他就愿意合作。那么当你面对一个好人的时候,你是合作还是背叛呢?你的理性选择是合作。

我们假设博弈双方是A和B两个人。 A是个喜欢合作的好人,B是个自私自利整天坑蒙拐骗的坏人。两人第一次博弈,B发现A没有背叛他,A居然和他合作了。

B就会想,A这个人是不是有点傻呢?那B应该怎么办呢?

如果囚徒困境要进行很多轮的话,合作对双方都有好处。这次A让B占了便宜,但是B知道A但凡有点脑子,也不可能让他永远占便宜。与其把A教育成坏人,还不如陪着他当好人,这样长期下来两个人都有好处。

所以B在下一轮选择了合作。当然我们知道,B之所以这么选,是因为他觉得A有点傻,A肯定会跟他合作 —— 对别人,B可不敢这么干。

这样几轮合作下来,A一看B每次都和他合作,他会认为B也是个好人!就这样,一个可能是真好人,一个是假装的好人,两人就这么一路合作下去了。直到最后的几轮,他们才会露出本来的面目。

这个理论叫做“KMRW定理”,用四个经济学家名字的首字母命名。KMRW定理说,在不完全信息博弈中,参与者不知道对方是好人还是理性人,那么只要博弈重复的次数足够多,合作能带来足够的好处,双方都会愿意维护自己是好人的这样一个声誉,前期尽可能地保持合作,到最后才选择背叛。

3.好人与社会

这个A和B的故事你是不是感觉有点熟悉?《射雕英雄传》里,黄蓉和郭靖刚刚相遇的时候,黄蓉本是个理性人,知道江湖险恶,所以坑蒙拐骗。但黄蓉发现郭靖的行为有点傻,居然是个好人。于是黄蓉 —— 在博弈论专家看来是完全理性地 —— 也选择做了好人。结果就成了两个好人快乐地生活在一起。

那我们现在回头想想,黄蓉到底是装好人,还是她本来就是个好人呢?更进一步,当初的郭靖到底是真好人,还是装好人呢?

从博弈论角度来说,这些问题已经不重要了。你在大多数情况下无法区分一个好人和一个理性人。

张维迎在《博弈与社会》这本书里讲到,KMRW定理可以解释“大智若愚”。

“智”,就是人要自私,一切行动都是为了自己的利益。“愚”,就是宁可吃亏也不背叛别人。每一轮都选择背叛,看似自私,其实那是“小智”。而如果宁可吃点亏也要选择合作,你就会建立一个良好的声誉,就会有更多的人跟你合作,从长期来这才是“大智”。

这就使我想起一个笑话。说小镇上有个傻青年,别人都喜欢拿一个游戏逗他玩。在地上摆一张十元和一张二十元的钞票,他每次都捡那张十元的。后来有个外地人来到小镇,慕名找到这个青年玩这个游戏,他果然捡了十元的钞票。外地人就忍不住问这个青年,说你为啥不捡二十元的钞票呢?

青年说,我要是捡二十元的钞票,还会再有人跟我玩这个游戏吗?

4.好人与理性人

所以理性人有充分的理由不暴露自己是个理性人,你应该假装自己是个好人。

那装好人要装到哪一步为止呢?有限次重复博弈的实验中,双方通常是到了倒数第二次博弈才暴露自己的理性人面目,选择背叛。生活中有些人的确是这么干的。比如领导干部有个“59岁现象”,老老实实做了一辈子革命工作,临退休捞一把大的。

但是59岁暴露可能还是太早了。人生的博弈并不在退休那一刻终止,你除了工作还有很多别的博弈,好人的声望可以一直有用!

也许你应该装到生命最后一刻。就好像一个著名的段子,说恋爱中的男女,女孩问男孩,你对我那么好是不是在骗我呢?男孩的回答非常符合博弈论精神,说如果我是在骗你,那就让我骗你一辈子吧。

那既然装好人有这么大的好处,我们为什么不做一个真的好人呢?做一个康德式的好人,跟人合作并不是因为合作有好处,而是我单纯认为这么做是对的!这样行不行呢?

博弈论专家绝对不会建议你去做真正的好人。好人经常对世界有一厢情愿的期待。有的好人认为他能感化别人,他觉得如果我这次跟人合作,哪怕吃了亏,下一次别人也会因为不好意思、或者为了回报我而跟我合作。博弈论专家会说这种想法非常危险。事实上,如果你身处一个比较险恶的社会环境,那你不但不应该做好人,而且应该装坏人 [6]。

不过话说回来,做真正的好人的确有个重大好处,那就是你会自我感觉很好。为了维持这个良好感觉,你宁可牺牲金钱的利益。这大约就是为什么在开头的那些实验里,有一半的人一上来就选择了合作。

现代社会就是这样,通俗小说、电影和电视剧里一般都是好人取得最后胜利。你被这样的文化熏陶,就不自觉地想要跟好人一伙儿。好人跟好人之间形成了一个想象的共同体。这其实是一个幻觉,但是没办法,想象的共同体是最强大的社会力量。

这种感觉有时候会如此强烈,以至于我们认为物质利益都是不值得的。这其实也是理性的!只要你知道自己心中什么最重要就行。

参考文献

[1] Avinash K. Dixit and Barry J. Nalebuff, The Art of Strategy: A Game Theorist's Guide to Success in Business and Life (2008).

[2] MAX NISEN, Scientists tested the 'Prisoner's Dilemma' on actual prisoners — and the results were not what you would expect, www.businessinsider.com.au, July 2013.

[3] David Levine, Is Behavioral Economics Doomed? The Ordinary versus the Extraordinary (2012).

[4] 张维迎,《博弈与社会》(2013)。

[5] Kreps D., R. Milgrom, J. Roberts and R. Wilson, Rational cooperation in the finitely repeated prisoners' dilemma,  Journal of Economic theory, 1982.

上一篇下一篇

猜你喜欢

热点阅读