博弈论9:其身不正,虽令不从
博弈的出发点是做一个 player,是每个参与者竞相采取对自己最有利的行动。生活中有些人自以为有权力别人就应该听他的,他就应该令行禁止说一不二,这就是没把别人当 player。殊不知,就算你名义上的权力再大,别人听不听你的那也看博弈的情况。
你想让你的孩子做一份课外的数学练习题。因为这不是老师布置的作业不属于分内的任务,孩子不想做,那你怎么办呢?也许你可以给他一个许诺,说他做完练习可以打一会儿游戏。这个条件似乎公平合理,但是很多时候孩子仍然不乐意。因为他不知道该不该相信你这个许诺,毕竟你以前说的话经常不算数。
类似这样的事情非常常见。每个商店可以说绝对没有假货,每个考生都可以说绝不作弊,每对情侣都可以说永不变心,而每个人都知道这些誓言根本不能当真。
说话要是好使还要枪干什么?但是,反过来说,如果我们能找到一些办法让说话真的好使,那又能省下多少麻烦呢?怎么样才能让你说的话真好使呢?
这可是诺贝尔奖得主托马斯·谢林的招牌工作。
1.威胁和承诺
动态博弈有两个基本概念,一个叫威胁,一个叫承诺。人类自古以来就有威胁和承诺的手段,但是要说逻辑清晰地把这两个手段说清楚,还得是托马斯·谢林1960年出版的《冲突的策略》这本书。
威胁和承诺都是在博弈双方都没有采取实质性行动之前,一方通知另一方的声明。
所谓威胁,就是我要求你不要去做某件事 —— 我说如果你做了,我就会对你进行惩罚。
所谓承诺,就是我要求你去做某件事 —— 如果你做了,我就会给你一个奖励。
威胁和承诺在本质上是一样的,都是我事先说好,会根据你下一步的行动采取一个相应的行动。
这听起来跟老百姓说的威胁和承诺是一个意思,但是托马斯·谢林提出一个关键的概念,叫做“可信性”。博弈论专家首要考虑的是你这个威胁或者承诺,是不是可信的。
张维迎在《博弈与社会》这本书里说了一个这样的例子。大学里的一次考试,教授发现一个学生的成绩,按理说应该给不及格。但是这个学生私下找到教授,说你能不能网开一面让我及格 — 你要是给我不及格,我就要报复你,我什么事情都可能做得出来!这显然就是一个威胁。那请问教授应该怎么办呢?
博弈论要求我们考察这个威胁的可信性。如果教授给他不及格,那么当这个学生面对不及格这个既成事实的时候,会怎么做呢?难道他真的会来报复教授吗?不报复,只不过就是一门课不及格而已。敢报复老师,那就是严重违纪,轻则被学校开除,重则被法律惩处。如果这个学生是理性的,他怎么可能因为一门课不及格就敢报复老师呢?
所以他那个威胁是不可信的。
博弈论说的可信不可信可不是说分析学生的人品、或者他说话的语气像不像说谎什么的,博弈论要做的是设身处地的利弊分析。不可信,是因为“事前最优”和“事后最优”的不一致。
教授打分之前,学生说你要给我不及格我就报复你,他也许真的很想这么做,但这只是事前最优。等到分数已经确定了,不及格是既成事实的情况下,学生的最优选择是接受,不报复 —— 因为报复不符合学生在那个情况下的自身利益。
对头脑清醒的人来说,只有可信的威胁和承诺才有意义 [1]。
咱们再举个例子。有个老头,他的女儿想要嫁给一位男青年,但是老头不同意,所以威胁女儿说要敢和这个人结婚,他就要断绝父女关系。
这个威胁可信吗?女儿完全可以分析,父亲和女婿之间并没有什么根本性的冲突,如果结婚已经既成事实,断绝父女关系并不符合父亲的利益。所以这个威胁是不可信的。
那你说老头应该怎么办呢?难道去买一本叫《如何说孩子才会听》的畅销书吗?当然没用。所谓“说服力”、“影响力”,一般都是动之以情,只在听不听都对自身利益影响不大的情况下才有用。百事可乐和可口可乐的味道差不多,共和党和民主党谁上台对中间选民来说都无所谓。博弈论研究的决策选择不是这种情绪化的东西,而是由利益格局决定的。
为了吸引一个很有潜力的年轻球员签约,俱乐部表示,只要你加入我们队,我们保证你的出场时间!如果球员的头脑清醒,他就不应该相信这个承诺。因为保证他上场并不符合球队的利益。球队的利益只可能是谁状态好谁上场。
不可信的威胁和承诺说了也是白说,只会让人觉得你这个人不靠谱。但是可信的威胁和承诺则是非常有用的。
2.如何说别人才会听
可信不可信,取决于事后的利益格局。只有你事后别无选择,履行自己的威胁或者承诺符合你在那个时候的利益,事前最优和事后最优一致,那才是可信的。
可信 = 别无选择。
为了发出可信的威胁或者承诺,你必须主动束缚自己的手脚。我大概总结了一下,有三种办法。
第一个办法是给别人惩罚你的权力。
商业往来中最常见的办法是签个合同。你给我供货,我承诺给你货款。那你怎么能相信我收到货之后一定给钱呢?因为有合同。如果违约,我面临的将是更大的罚款 —— 所以即便是事后,履行承诺也符合我的最优利益。
锻炼身体这件事,本质上是现在的你和将来的你之间的一个博弈。现在的你立志说我从此之后每天都要锻炼身体,一定要把体重降下来!可是将来的你会找到各种借口不锻炼。
想要让锻炼的承诺可信,你可以找一个朋友 —— 甚至找一个什么机构 —— 把一大笔块钱交给他。你说如果半年之后我的体重没有减掉10斤,这笔钱就归你了。这笔钱会大大增加你锻炼的动力。曾经有一位经济学家和他的同事有过这样的协议,两人说好按体重增加的斤两算钱,他真的收了朋友一万五千美元。
对爱情最好的承诺是结婚。现代婚姻具有法律效力,离婚那是要分割财产的。
第二个办法是主动取消自己的选项。
中国人的说法叫破釜沉舟,英文世界的说法是“烧掉你身后的桥” —— 我取消了撤退这个选项,现在我们只能前进。这比什么动员演说都有用。
反过来说,你减少自己一方选项的同时,还可以给对手一方增加选项。《孙子兵法》中有一句话叫“围师必阙”,说包围了敌人最好要留个出口,让敌人有逃跑的选项。这个不是阴谋,而是阳谋。有逃跑的选项,敌人就不会拼死做困兽犹斗,我方就能用最小的代价取得胜利。
带兵在外的将领主动切断跟总部的联络、商店宣布价格匹配政策、厂家发行限量版的产品、乃至于结婚要送钻戒、尤其过去结婚还要送彩礼、婚礼要广邀亲朋大办特办,都可以说是用取消自己未来选项的方式提供可信性。
张维迎还说过一个有意思的现象。为什么一个画家死了,他的作品就会升值呢?这是一个最有力的承诺:他将来不会再出新作品去跟他现有的作品竞争了。
第三个办法是建立声望。如果你是个有信誉的人,那你就算不提供任何附加的动作,你说的话也是可信的。这是因为如果你说话不算数,你的名声会受损。
孔子说“其身正,不令而行;其身不正,虽令不从。”声望最大的好处就是它允许你无需花费任何成本就能提出可信的威胁和承诺。损害声望,就是对你失信最大的惩罚。
而声望是需要积累的,积累声望的过程是一个处处受限、不自由的过程。如果你没有声望,那就只能用前面说的那些办法。
3.博弈论的游戏
总而言之,所有这些方法都是通过自我限制,来提升自己的可信性。可信的人非常有力量,他说话别人就会听 —— 可以说自由来自自律,有一种击败叫放任,有一种赋能叫失能。
其实这是一个有点违反人的本性的做法,人在直觉上都是想增加自己的选项,不愿意给自己带个紧箍。如果我现在要权有权要钱有钱,为什么主动找一帮人管着我呢?
实行民主的政府,其实有更大的力量。比如说发行公债。只有你这个制度能保证在政府如果违约就会受到惩罚,人民才愿意借钱给政府。政府可能受到的惩罚越大,它的融资能力就越强。英国在光荣革命之后的国债规模就是越来越大,这才保证了英国打赢历次战争。
可是我忍不住就想,像沙特这样的政府,对人民一贯都是“不问你信不信就问你服不服”,为啥好像力量也很大呢?
按照博弈论的逻辑,答案也许是这样的 ——
政府之所以要自缚手脚,是为了取信于民。
政府之所以要取信于民,是因为它把自己当做是个 player,在跟民众玩一个博弈的游戏。
政府之所以要玩这个游戏,是因为民众有想法有力量,是可以独立自主地决定自己采取什么行动的 player。
沙特政府的收入来源是对石油的掌控,沙特政府并不强烈依赖沙特人民。沙特的民众是一盘散沙,沙特没有什么王室之外的、强有力的公司和组织,不具备那种能跟政府对等博弈的力量。
所以归根结底,博弈论是属于 player 的理论。
注释
[1] 有些博弈论书中会用不同的名词标记可信和不可信的威胁和承诺,比如不一定可信的威胁叫“警告”,不一定可信的承诺叫“许诺”等等,我们这里就不做这种标记了。