博弈与合作——满怀慈爱的博弈论
2014-05-24 本文已影响230人
翟英昌
上一节中,通过对民主与强权的对比,我们初步了解权限合理化在合作中的重要作用。这一节,我们聊聊博弈论及其对合作的启示。
囚徒的困境
“囚徒困境”是1950年美国兰德公司提出的博弈论模型。让我们拿好小板凳,先围观一下下!
背景:两个共谋犯罪的人被关入监狱,不能互相沟通。
- 情况一:如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;(最优解)
- 情况二:若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;(次优解)
- 情况三:若互相揭发,则因证据确实,二者都判刑八年。(最差解)
结果:由于囚徒无法通信或信任对方,因此倾向于互相揭发(最差解),而不是同守沉默(最优解)。
在对囚徒困境进行分析之前,我们先对博弈论的基本要素进行一下科普。
博弈论科普
博弈论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。基本要素:
- 玩家(Players):每一个有决策权的参与者。
- 规则(Rules):在博弈中,每个玩家必须遵守的规则。
- 策略(Strategies):在博弈中,每个玩家可选择决策的集合。
囚徒困境的分析
玩家层面。表面上,是两个囚徒在博弈。实际上,还有第三个玩家,警察。所以,这不是一场“双人博弈”,而是一场“三方博弈”。 启示:在一场博弈中,看不到隐藏的对手是最危险的。
规则层面。警察垄断了规则(Rules)。本质上,这不是一场“对称博弈”,而是一场“非对称博弈”。规则的不对称,必然导致优势的不对称。所以,囚徒必败,警察必胜。启示:规则不对称的局,勿入,除非你是优势方。
策略层面。囚徒的失败,不是策略(或者算力不足)的问题,而是规则的问题。静态的“非重复博弈”,往往会造成玩家的短视。动态的“重复博弈”,往往会提高玩家的双赢能力。启示:算力强,只是在博弈中胜出的必要条件,但不是充分条件。
博弈论对合作的启示
关键点:尽力促成“重复博弈/重复合作”。 时间是最好的试金石。“重复博弈/重复合作”借助时间的力量,会实现两个转化。
- 将“非合作博弈”转化为“合作博弈”;
- 将“零和合作”转化为“双赢合作”。
这样,将博弈论这套饱受争议的理论,由“阴险狡诈的工具”转化为“满有慈爱的智慧”。
在前者基础之上:
- 让更多的玩家参与其中。(More Players)
- 双赢规则优先。(Smart Rules)
- 努力提高算力,不要成为团队的累赘。(Good Strategies)