读书笔记

合作,才能多赢

2020-02-19  本文已影响0人  苏耀勇

几乎所有关于博弈论的书都会提到囚徒困境,《合作的进化》《超级合作者》以及这次阅读的《策略思维》都从囚徒困境说起,在《得到》专栏也有非常多的课程讲解了囚徒困境。囚徒困境几乎成了博弈论的代名词。这次,再看《策略思维》,从不同的地方、不同的角度学习囚徒困境,了解博弈论,又有一些新的理解。拓展开来,现实中还有各种各样我们没有识别出来的囚徒困境,那些看起来始终解决不了的问题,有些也是囚徒困境,比如超载的货车司机,就是一个对多个的囚徒困境,更加难以破解。
关于博弈,《策略思维》提供了多个思维工具,让我们将现实中遇到的问题看得更加透彻。

轮流出招时的策略

对于大家轮流出招的地方,策略是向前展望,倒后推理。在这方面,最典型或者说最抽象的案例是象棋、围棋等棋类游戏。象棋大师们可以对象棋残局进行向前展望,预见到博弈的结局,预见到一方是否有一个万无一失的取胜策略,或者双方打平;围棋高手可以对围棋局部死活局进行推导,找到正解。
轮流出招的结果是,先出招的人会意识到,后出招的人会根据自己的策略随时调整对策,因此前者必须考虑自己的选择对其他参与者的影响。比如,一个准备进入饮料行业的新公司,必须考虑原有的市场占有者会不会采取价格战将新人赶出市场。和资方谈判的工会代表必须考虑到资方对提高工作的应对策略和罢工对双方的害处。通过这样向前展望,列举出所有未来可能性,同时通过倒后推理,从最好的结果返回,找到我们最佳的方案。

同时出招时的策略

剪刀石头布,还有酒后猜拳等,就是同时出招的博弈游戏。在预测对方行为的同时,保证自己不被预测到。对于这种情况,有三种策略:
优势策略。 在所有的可选方式中,有一个优势策略,这就是你必须选择的策略。比如在典型的囚徒困境中,招供就是一个优势策略:你招供,对方没有招供,你的结果是无罪释放;你招供,对方也招供,你只判刑 2 年(如果对方招供的时候,你没有招供,你将被判 5 年)。因此,在双方没有串通信息(双方都不招供,只判一年),没有其他因素影响的时候,招供就是你的首选。
在苏州超载司机的情况中,所有货车司机都是参与博弈的人群。如果司机甲超载,其他所有的司机都不超载,那么,这个司机就会获得超额的利润;当司机甲超载,其他司机也超载的时候,大家都只能获得平均利润;当司机甲不超载,其他司机都超载的时候,司机甲就会亏损,被市场淘汰。因此,在各种情况下,超载都是有利的,因此它是一个优势策略(当然,这里的前提是没有超载的其他不良后果),这也是超载行为屡禁不止的一个原因。
劣势策略。在所有的方式中,当你找不到优势策略的时候,通过反向思维,去寻找劣势策略,逐个排查劣势策略并避免选择劣势策略。在上面的策略中,不招供就是劣势策略。
均衡策略。顾名思义,这种情况下,博弈结果达到了平衡状态,参与博弈的双方(多方)不改变(或者无法单方面改变)平衡状态。均衡策略还有另外一个名字:纳什均衡。纳什是一位数学家,电影《美丽心灵》就是以他为素材的精彩故事。纳什因为提出纳什均衡理论而获得诺贝尔奖。现实中的事情如果有着以下特点,可能就是一个纳什均衡:参与博弈的各方都会选择自己的一个确定性优势策略,不做改变,并且也无法改变其他参与方的策略。没有突发事件或者足够的外部力量干涉,平衡状况就无法打破。
苏州超载司机事件中,交警、路政、消费者、运输公司和司机等就构成了一个纳什均衡:超载的状态很长时间里都维持不变,运输费用也一直保持在低位。在去年垮桥事件后,交警严厉执法,对超载行为进行严厉打击,不知道是否能够成功治理超载,改变纳什均衡呢?如果措施不当,是有可能又回到原状的,至少,向前反推十几年,垮桥的事情发生了很多次。
为了在博弈中占据上风,获得足够利益,《策略思维》还提供了很多其他方法,比如如何威慑(美苏两个国家的核威慑行为),如何许诺和保证(大棒加萝卜),以改变对方的行为。但是,这些博弈或许都属于零和博弈的范畴。人类社会发展到今天,更重要的是合作分工,正是有了合作分工,才有了人类社会今天的繁荣和发达,人类作为个体是没有能力对抗自然界任何一种食肉动物的,作为集体,却可以在月球上留下脚印。因此,《策略思维》后面关于如何合作的部分才是更需要关注和学习的。

如何合作?

密歇根大学的政治学学者罗伯特·阿克塞尔罗德(Robert Axelrod)提出了一个以牙还牙的法则,《合作的进化》将它命名为好人策略。基本原则是:清晰、善意、刺激性和宽容。为了证明这一点,阿克塞尔罗德设计了一个两人囚徒困境博弈锦标赛。世界各地的博弈论专家通过电脑程序的方式提交各自的策略进行比赛,结果,经过多次比赛,最终胜利者就是以牙还牙的策略。
什么是以牙还牙策略?首先,以善意的态度,合作的方式对待别人;如果遭受背叛,下次就以同样的态度对待对方;再下次如果对方回心转意,就原谅对方,继续合作。
吴军在《谷歌方法论》中这样讲他的合作原则:

第一次会无条件相信对方,这样合作的成本最低。如果被骗,那么则永远不相往来,没有例外,有错改了也不是好同志。“一朝是贼,永远是贼”。

结束语

这个世界在变得越来越透明,信息流通越来越快速。“青岛虾"事件也证明了以前旅游区一锤子买卖坑人行为也将难以为继。你在某一个事件中的博弈行为,会影响到其他人对你下一次行为的预测,因此,从长期看,吴军的”简单、善良、惩罚“合作方式是一个比较好的人生策略。

上一篇下一篇

猜你喜欢

热点阅读