博弈论：装好人的好处

2023-04-30 本文已影响0人小道萧兮

1、好人与囚徒困境

以前有个电视节目：

两个人组队答题，答对之后两人会获得一笔奖金，节目的最大看点是怎么分这笔钱。规则是每人在一张纸条上写“朋友”或“敌人”这两个词中的一个。如果两人写的都是“朋友”，就平分这笔钱。如果一个人写“朋友”一个人写“敌人”，那么写“敌人”的人就拿走所有的钱，写“朋友”的人什么都得不到。如果两个人写的都是敌人，那就是谁也得不到。

这是一个典型的囚徒困境，而且博弈只发生一次。

写“敌人”，要么你拿所有的钱，要么你就一分钱都拿不到。
写“朋友”，要么你拿一半的钱，要么你就一分钱都拿不到。

显然两个人的压倒性策略都是写“敌人”。

然而节目中的真实情况是 53.7% 的女性和 47.5% 的男性都选择了合作，他们写下了“朋友”。

这些人在金钱面前选择了相信一个素昧平生的人。他们宁可被人背叛，也不愿背叛别人。他们选择了做好人。类似这样的研究有很多，甚至有经济学家还专门跑到监狱里去，让真正的囚徒玩了囚徒困境的游戏。这些研究的结果高度一致：有一半、甚至一半以上的人选择做好人。

难道这些人都是非理性的吗？

一个解释是这些人的确有点非理性了，因为他们玩这种游戏都还不够熟练。人在做熟悉的事情的时候通常是相当理性的。比如有实验证明，如果让一群人连续跟不同的对手玩过几把囚徒困境游戏，他们的行为就会趋于理性，会更多地选择背叛。这就好像在社会中见识了人性之恶，会把人变得成熟一样。

但有意思的是，如果让固定的两个人连续玩比如说 100 次囚徒困境游戏，他们会大量地合作，一直到最后几轮才开始互相背叛。

这似乎容易理解，我们在熟人面前总是做好人。但是，简单的博弈论分析并不支持这个做法！这个现象，曾经是一个著名的悖论。

2、好人与有限次重复博弈

上一讲说重复博弈会促进合作，因为可以惩罚那些不合作的人。但是请注意，上一讲说的重复博弈，其实有个隐含的假设，那就是重复次数是无限的。在有限次的重复博弈中，按理说，你还是不应该合作。

这个结论有点怪，但是逻辑很清楚。比如两个人总共要进行 100 次囚徒困境博弈。咱们先考虑最后一次博弈。这时候因为后面就没有惩罚的机会了，双方的压倒性策略都是背叛。对吧？

好，那既然如此，第 99 次博弈的时候你会怎么做？双方都已经算出来了下次对方肯定背叛，那这次还能合作吗？所以第 99 次博弈必定也是互相背叛。

那同样道理，第 98 次博弈也应该是互相背叛……有限次重复博弈中的每一次博弈都应该是互相背叛才对。

可是实验中为什么不是这样呢？两个人直到最后阶段才背叛，前面是连续的合作。是因为他们不会计算吗？对此，我至少听到过两个解释。

一个解释认为，真实生活中的博弈次数的确是有限的，但是也是随机的 —— 如果我们不知道互相还会有几次博弈，甚至不知道下次还会不会有博弈，那么为了避免将来可能的惩罚，这次还是应该选择合作。正所谓“做人留一线，日后好相见。”

还有一种解释认为，就算我们明确知道未来还会有多少次博弈，理性选择也应该是先合作。这个理论是 1982 年才被四个经济学家提出来的，叫“四人帮模型”。

“四人帮模型”这个解释的关键在于，对方到底是不是理性的人，这个信息是不完全的，这叫做“不完全信息博弈”。如果双方都明确知道对方是理性的人，那有限次重复博弈就不会有合作。可是社会上有些人就愿意当好人，他愿意合作。那么当你面对一个好人的时候，你是合作还是背叛呢？你的理性选择是合作。

假设博弈双方是 A 和 B 两个人。 A 是个喜欢合作的好人，B 是个自私自利整天坑蒙拐骗的坏人。第一次博弈 B 发现 A 没有背叛，A 居然合作了。那 B 应该怎么办呢？

如果囚徒困境要进行很多轮的话，合作对双方都有好处。这次 B 占了便宜，但是 B 知道 A 不可能让他永远占便宜。与其把 A 教育成坏人，还不如陪着他当好人，这样长期下来两个人都有好处。

所以 B 在下一轮选择了合作。B 之所以这么选，是因为他觉得 A 有点傻，肯定会跟他合作 —— 对别人，B 可不敢这么干。

这样几轮合作下来，A 看 B 每次都和他合作，他会认为 B 也是个好人！就这样，一个是真好人，一个是装好人，两人就这么一路合作下去了。直到最后的几轮，他们才会露出本来的面目。

这个理论叫做“KMRW定理”，用四个经济学家名字的首字母命名。

KMRW 定理说，在不完全信息博弈中，参与者不知道对方是好人还是理性人，那么只要博弈重复的次数足够多，合作能带来足够的好处，双方都会愿意维护自己是好人的这样一个声誉，前期尽可能地保持合作，到最后才选择背叛。

3、好人与社会

《射雕英雄传》里，黄蓉和郭靖刚刚相遇的时候，黄蓉本是个理性人，知道江湖险恶，所以坑蒙拐骗。但黄蓉发现郭靖的行为有点傻，居然是个好人。于是黄蓉也选择做好人。结果就成了两个好人快乐地生活在一起。

我们回头想想，黄蓉到底是装好人，还是她本来就是个好人呢？更进一步，当初的郭靖到底是真好人，还是装好人呢？

从博弈论角度来说，这些问题已经不重要了。你在大多数情况下无法区分一个好人和一个理性人。

KMRW定理可以解释“大智若愚”。

“智”，就是人要自私，一切行动都是为了自己的利益。“愚”，就是宁可吃亏也不背叛别人。每一轮都选择背叛，看似获得了利益，其实那是“小智”。而如果宁可吃点亏也要选择合作，就会建立一个良好的声誉，就会有更多的人跟你合作，从长期来这才是“大智”。

这就使我想起一个笑话。小镇上有个傻青年，别人都喜欢拿一个游戏逗他玩。在地上摆一张十元和一张二十元的钞票，他每次都捡那张十元的。后来有个外地人来到小镇，慕名找到这个青年玩这个游戏，他果然捡了十元的钞票。外地人就忍不住问这个青年，说你为啥不捡二十元的钞票呢？

青年说，我要是捡二十元的钞票，还会再有人跟我玩这个游戏吗？

4、好人与理性人

所以理性人有充分的理由不暴露自己是个理性人，你应该假装自己是个好人。

那装好人要装到哪一步为止呢？有限次重复博弈的实验中，双方通常是到了倒数第二次博弈才暴露自己的理性人面目，选择背叛。生活中有些人的确是这么干的。比如领导干部有个“59岁现象”，老老实实做了一辈子革命工作，临退休捞一把大的。

但 59 岁暴露可能还是太早了。人生的博弈并不在退休那一刻终止，你除了工作还有很多别的博弈，好人的声望可以一直有用！

也许你应该装到生命最后一刻。就好像一个著名的段子，说恋爱中的男女，女孩问男孩，你对我那么好是不是在骗我呢？男孩的回答非常符合博弈论精神：如果我是在骗你，那就让我骗你一辈子吧。

做真正的好人的确有个重大好处，那就是你会自我感觉很好。为了维持这个良好感觉，你宁可牺牲金钱的利益。这大约就是为什么在开头的那些实验里，有一半的人一上来就选择了合作。

现代社会就是这样，小说、电影和电视剧里一般都是好人取得最后胜利。被这样的文化熏陶，就不自觉地想要跟好人一伙儿。好人跟好人之间形成了一个想象的共同体。这其实是一个幻觉，但是没办法，想象的共同体是最强大的社会力量。

下一篇：博弈论：布衣竞争，权贵合谋

博弈论：装好人的好处

1、好人与囚徒困境

2、好人与有限次重复博弈

3、好人与社会

4、好人与理性人

猜你喜欢

热点阅读