博弈论:装好人的好处
上一篇:博弈论:不纵容,但要宽容
1、好人与囚徒困境
以前有个电视节目:
两个人组队答题,答对之后两人会获得一笔奖金,节目的最大看点是怎么分这笔钱。规则是每人在一张纸条上写“朋友”或“敌人”这两个词中的一个。如果两人写的都是“朋友”,就平分这笔钱。如果一个人写“朋友”一个人写“敌人”,那么写“敌人”的人就拿走所有的钱,写“朋友”的人什么都得不到。如果两个人写的都是敌人,那就是谁也得不到。
这是一个典型的囚徒困境,而且博弈只发生一次。
写“敌人”,要么你拿所有的钱,要么你就一分钱都拿不到。
写“朋友”,要么你拿一半的钱,要么你就一分钱都拿不到。
显然两个人的压倒性策略都是写“敌人”。
然而节目中的真实情况是 53.7% 的女性和 47.5% 的男性都选择了合作,他们写下了“朋友”。
这些人在金钱面前选择了相信一个素昧平生的人。他们宁可被人背叛,也不愿背叛别人。他们选择了做好人。类似这样的研究有很多,甚至有经济学家还专门跑到监狱里去,让真正的囚徒玩了囚徒困境的游戏。这些研究的结果高度一致:有一半、甚至一半以上的人选择做好人。
难道这些人都是非理性的吗?
一个解释是这些人的确有点非理性了,因为他们玩这种游戏都还不够熟练。人在做熟悉的事情的时候通常是相当理性的。比如有实验证明,如果让一群人连续跟不同的对手玩过几把囚徒困境游戏,他们的行为就会趋于理性,会更多地选择背叛。这就好像在社会中见识了人性之恶,会把人变得成熟一样。
但有意思的是,如果让固定的两个人连续玩比如说 100 次囚徒困境游戏,他们会大量地合作,一直到最后几轮才开始互相背叛。
这似乎容易理解,我们在熟人面前总是做好人。但是,简单的博弈论分析并不支持这个做法!这个现象,曾经是一个著名的悖论。
2、好人与有限次重复博弈
上一讲说重复博弈会促进合作,因为可以惩罚那些不合作的人。但是请注意,上一讲说的重复博弈,其实有个隐含的假设,那就是重复次数是无限的。在有限次的重复博弈中,按理说,你还是不应该合作。
这个结论有点怪,但是逻辑很清楚。比如两个人总共要进行 100 次囚徒困境博弈。咱们先考虑最后一次博弈。这时候因为后面就没有惩罚的机会了,双方的压倒性策略都是背叛。对吧?
好,那既然如此,第 99 次博弈的时候你会怎么做?双方都已经算出来了下次对方肯定背叛,那这次还能合作吗?所以第 99 次博弈必定也是互相背叛。
那同样道理,第 98 次博弈也应该是互相背叛……有限次重复博弈中的每一次博弈都应该是互相背叛才对。
可是实验中为什么不是这样呢?两个人直到最后阶段才背叛,前面是连续的合作。是因为他们不会计算吗?对此,我至少听到过两个解释。
一个解释认为,真实生活中的博弈次数的确是有限的,但是也是随机的 —— 如果我们不知道互相还会有几次博弈,甚至不知道下次还会不会有博弈,那么为了避免将来可能的惩罚,这次还是应该选择合作。正所谓“做人留一线,日后好相见。”
还有一种解释认为,就算我们明确知道未来还会有多少次博弈,理性选择也应该是先合作。这个理论是 1982 年才被四个经济学家提出来的,叫“四人帮模型”。
“四人帮模型”这个解释的关键在于,对方到底是不是理性的人,这个信息是不完全的,这叫做“不完全信息博弈”。如果双方都明确知道对方是理性的人,那有限次重复博弈就不会有合作。可是社会上有些人就愿意当好人,他愿意合作。那么当你面对一个好人的时候,你是合作还是背叛呢?你的理性选择是合作。
假设博弈双方是 A 和 B 两个人。 A 是个喜欢合作的好人,B 是个自私自利整天坑蒙拐骗的坏人。第一次博弈 B 发现 A 没有背叛,A 居然合作了。那 B 应该怎么办呢?
如果囚徒困境要进行很多轮的话,合作对双方都有好处。这次 B 占了便宜,但是 B 知道 A 不可能让他永远占便宜。与其把 A 教育成坏人,还不如陪着他当好人,这样长期下来两个人都有好处。
所以 B 在下一轮选择了合作。B 之所以这么选,是因为他觉得 A 有点傻,肯定会跟他合作 —— 对别人,B 可不敢这么干。
这样几轮合作下来,A 看 B 每次都和他合作,他会认为 B 也是个好人!就这样,一个是真好人,一个是装好人,两人就这么一路合作下去了。直到最后的几轮,他们才会露出本来的面目。
这个理论叫做“KMRW定理”,用四个经济学家名字的首字母命名。
KMRW 定理说,在不完全信息博弈中,参与者不知道对方是好人还是理性人,那么只要博弈重复的次数足够多,合作能带来足够的好处,双方都会愿意维护自己是好人的这样一个声誉,前期尽可能地保持合作,到最后才选择背叛。
3、好人与社会
《射雕英雄传》里,黄蓉和郭靖刚刚相遇的时候,黄蓉本是个理性人,知道江湖险恶,所以坑蒙拐骗。但黄蓉发现郭靖的行为有点傻,居然是个好人。于是黄蓉也选择做好人。结果就成了两个好人快乐地生活在一起。
我们回头想想,黄蓉到底是装好人,还是她本来就是个好人呢?更进一步,当初的郭靖到底是真好人,还是装好人呢?
从博弈论角度来说,这些问题已经不重要了。你在大多数情况下无法区分一个好人和一个理性人。
KMRW定理可以解释“大智若愚”。
“智”,就是人要自私,一切行动都是为了自己的利益。“愚”,就是宁可吃亏也不背叛别人。每一轮都选择背叛,看似获得了利益,其实那是“小智”。而如果宁可吃点亏也要选择合作,就会建立一个良好的声誉,就会有更多的人跟你合作,从长期来这才是“大智”。
这就使我想起一个笑话。小镇上有个傻青年,别人都喜欢拿一个游戏逗他玩。在地上摆一张十元和一张二十元的钞票,他每次都捡那张十元的。后来有个外地人来到小镇,慕名找到这个青年玩这个游戏,他果然捡了十元的钞票。外地人就忍不住问这个青年,说你为啥不捡二十元的钞票呢?
青年说,我要是捡二十元的钞票,还会再有人跟我玩这个游戏吗?
4、好人与理性人
所以理性人有充分的理由不暴露自己是个理性人,你应该假装自己是个好人。
那装好人要装到哪一步为止呢?有限次重复博弈的实验中,双方通常是到了倒数第二次博弈才暴露自己的理性人面目,选择背叛。生活中有些人的确是这么干的。比如领导干部有个“59岁现象”,老老实实做了一辈子革命工作,临退休捞一把大的。
但 59 岁暴露可能还是太早了。人生的博弈并不在退休那一刻终止,你除了工作还有很多别的博弈,好人的声望可以一直有用!
也许你应该装到生命最后一刻。就好像一个著名的段子,说恋爱中的男女,女孩问男孩,你对我那么好是不是在骗我呢?男孩的回答非常符合博弈论精神:如果我是在骗你,那就让我骗你一辈子吧。
做真正的好人的确有个重大好处,那就是你会自我感觉很好。为了维持这个良好感觉,你宁可牺牲金钱的利益。这大约就是为什么在开头的那些实验里,有一半的人一上来就选择了合作。
现代社会就是这样,小说、电影和电视剧里一般都是好人取得最后胜利。被这样的文化熏陶,就不自觉地想要跟好人一伙儿。好人跟好人之间形成了一个想象的共同体。这其实是一个幻觉,但是没办法,想象的共同体是最强大的社会力量。
下一篇:博弈论:布衣竞争,权贵合谋