那些让我们受益一生的经济学概念之:博弈论
今天是『那些让我们受益一生的经济学概念』系列的最后一篇文,我们一起来说说博弈论。首先做个健脑操,思考一个有趣的问题:
有五个海盗,劫了100两金子要分赃。他们决定通过抓阄来决定分赃方案:
抓到第一个阄的人可以先提出一个分配方案,如果方案有一半以上的人同意,就照他的方案分金子,否则第一个人就要被杀掉。余下的人以此类推。
问题来了:如果你是第一个人,你会提出什么方案?
我们假定,每个人都是只追求自己的利益最大化。
我估计有部分读者会提出平均分配:每人20两呗,谁还会有异议?又或者采取最安全的保命做法:自己一分不要,你们爱怎么分就怎么分!
但这都并非正确答案哦!请再花个两三分钟认真思考一下。
第一个人唯一正确的答案是:100两金子全部归我!
而且这个方案一定会被一半以上的人同意,第一个人不会被杀掉。
是不是和直觉有点相悖?那这个答案是怎样得出的呢?
让我们用经济学家的思维来一起解答这道题。
经济学家最根本的假设是理性人,即每个人都在追求自己的利益最大化。经济学家最重要的思维之一是边际考虑,即考虑问题时从最后一个变化单位开始。我们就从最后一个人,即第五个人开始考虑。
轮到第五个人提方案的时候,其他的人都已经死掉了,金子将全部是他的,所以使他利益最大化的行为是,不管前面是谁,提了什么方案,他全部一概否决。
再看第四个人,他知道无论他提什么方案,第五个人都会否决,他都会被杀掉,所以他利益最大化的方案是:尽量不要轮到自己提方案。所以,不管第一个人提了什么方案,他都会同意。
然后看第三个人,知道第四和第五个人的选择策略后,他的利益最大化的方案是100两金子全归自己。因为他知道轮到自己提方案时,只剩下三个人,而自己和第四个人会同意,这样就超过了一半以上的人同意,行得通。所以不管第一个人提什么方案,第三个人都会反对。
再看第二个人,他明白无论自己提什么方案,第三、和第五个人都会反对,怎样都无法达到半数以上的人同意,一旦轮到自己提方案,就死定了,所以无论第一个人提什么方案,他利益最大化的行为就是同意。
所以,不管第一个人提什么方案,第二和第四个人都会同意,加上第一个人自己,就是三人同意超过半数,可以通过。既然第一个人提出的任何方案都可以通过,而第一个人追求的是自己利益的最大化,那他的方案就应该是:100两金子全归自己。
是不是有点烧脑但很有趣?
这个小故事其实是想告诉大家:在现实中,我们不是在一个毫无干扰的真空世界里做决策,我们的每一个选择每一步行动都会影响到周围的其他决策制定者,而他们的选择也会反过来影响到我们。这就是博弈论讨论的主题。
博弈论是著名数学家冯.诺依曼(John von Neumann,1903-1957)开创的,他在20世纪40年代写了一本书《博弈论与经济学》,是博弈论的开山之作。
诺依曼的博弈论主要是合作博弈论,即在大家遵守协议的情况下发生的博弈行为。而我们现在说的博弈论主要是非合作博弈论,即相互之间没有约束力下的博弈行为。非合作博弈论的开创者是我们比较熟悉的美国电影《美丽心灵》(A Beautiful Mind)中的主人公约翰.纳什,他获得了1994年诺贝尔经济学奖,而他获奖的主要工作体现在其1950年的博士论文《非合作博弈》中。纳什定义了我们经常听到的纳什均衡:这是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。
我们常在新闻报道中听到:大国博弈、企业与消费者的博弈、企业与政府的博弈之类的说法,会不自觉认为博弈是一个离我们很远且博大精深的概念。其实理解了博弈论的概念,再稍稍多一些观察,就会发现我们日常的很多决策和行动都涉及到博弈论,掌握博弈论的一些基本原则和方法,能让我们更加从容智慧地面对人生的各种复杂决策。
用博弈树帮我们梳理决策思路
有些决策可能很简单,只需要我们做一次判断就行。但生活和工作中,我们会遇到一些更复杂的决策问题,涉及多个参与者,多个选择,以及多次反馈循环,单靠我们在大脑中『暗箱操作』 显然不够用,我们需要一些视觉辅助工具来帮助我们分析情况,梳理思路,再做出正确的决策。决策树和博弈树就是这样的工具。
决策树相信大家都很熟悉,它是利用树状图帮助我们理清思路,分析不同选择带来的不同后果。博弈树也具有同样的功效,但两者的区别在于,决策树适用于一个人面临各种选择时的描述分析,而博弈树则适用于多个参与者在一场策略博弈中的决策次序的描述分析。
我们先看一个决策树的例子:比如你想从深圳去上海,可以坐汽车、坐火车或者坐飞机,且上述三种交通方式又都包含几个不同的选择,这些选择用决策树来描述分析的话,是这样的:
那博弈树有什么不同呢?博弈树描述分析的问题性质不同。博弈树描述分析的是这类问题:
假设在某个地区,洗衣粉市场由一家名为“快洁”的公司独占,而另一家名为“新洁”的新公司正考虑是否进军这个市场。若“新洁”决定进入,“快洁”将面临两个选择:一是接纳“新洁”,和平共处,但其市场份额会下降;二是打一场价格战。若“快洁”接纳“新洁”,后者可以赚得10万美元利润;若“快洁”发动价格战, “新洁”将遭受20万美元损失。如若“新洁”决定不进入这个市场,那它的利润当然为零。而对于“快洁”来说,作为一个垄断者它可以赚取30万美元利润。与“新洁”分享市场后利润则降为10万美元,如果发动一场价格战其代价为10万美元。
这个复杂的商业博弈情景如果用博弈树画出来就会让人一目了然:
好记性不如烂笔头,与其挑战自己大脑的记忆和理解能力,不如在纸上勾勾画画。很多时候,我们在脑海中百思不得其解的问题,写在纸上答案很快会跃然而出。我自己更喜欢用传统的纸笔写写划划,这种非常带感的体验能帮助我更加清晰深刻地梳理和分析问题。当然手写的弊端就是速度慢,保存麻烦。习惯了电子化的小伙伴可以用各种思维导图工具来画决策树和博弈树。
博弈论的经典法则一:向前展望,倒后推理
我们遇到的博弈情境通常分为两类,第一类是博弈的参与者同时出招,即自己出招时并不知道其他参与者会怎么做。第二类是博弈的参与者相继出招,即自己出招时必须预计其他参与者接下来的行动。这两种不同博弈类型的应对策略各有不同。
对于相继出招的策略博弈来说,总原则是每个参与者必须预计其他参与者接下来的行动,并据此确定自己的最佳招数。这就是博弈论的经典法则一:向前展望,倒后推理。
我们在开篇提到的海盗分金的故事以及洗衣粉品牌新洁和快洁的市场战,就是这个法则的两个典型应用场景。遇到相继出招的博弈,可以画博弈树来理清思路,很多情况下,每条选择路径都会在有限次的选择之后到达终点。如果一个博弈无论选择哪条路径都会在有限次行动之后到达终点,我们在理论上就可以完全解决这个博弈。这意味着沿着博弈树倒后推理,我们能找出谁将取胜以及他将怎样取胜。所以一旦走通了整棵博弈树,整个博弈问题就会迎刃而解。
博弈论的经典法则二:找到你的优势策略
对于参与者同时行动的博弈,决策的关键是找到自己的优势策略。我们通过一个例子来具体说明。
为了抢生意,每个星期一两家相邻的餐厅山珍餐厅和海味餐厅都会根据时令推出一款新菜式。当山珍餐厅的主厨绞尽脑汁研发新菜式时,他知道海味餐厅的主厨也在做同样的事。同样,海味餐厅的主厨研发新菜式时也知道山珍餐厅的主厨正在努力。
这两家餐厅实际上在进行一场同时行动的博弈 他们都需要在不能提前知晓对方行动方案的情况下做出选择。也就是说他们只能通过看穿对方的策略才能采取行动。那如何才能看穿对方的策略?也许看穿对方的策略不是那么容易做到,但采取自己的优势策略却是可行的。我们具体分析一下:
假设10月的某个星期,鲜甜的大闸蟹和肥美的生蚝上市了,两家餐厅的主厨需要选择研发哪一道菜式更能吸引吃货们进店消费。
我们假设:
1)30%的吃货对生蚝感兴趣;
2)70%的吃货对大闸蟹感兴趣;
3)如果两家餐厅都用同一种原材料研发新菜式,则吃货们一半会进山珍餐厅消费,一半会进海味餐厅消费。
现在,山珍餐厅的主厨会进行如下推理:
1)如果海味餐厅采用大闸蟹做新菜,我们采用生蚝做新菜,则我们可以获得30%的客户;
2)如果海味餐厅采用大闸蟹做新菜,我们也采用大闸蟹做新菜,则我们可以获得35%的客户(70%的一半);
3)如果海味餐厅采用生蚝做新菜,我们采用大闸蟹做新菜,则我们可以获得70%的客户;
4)如果海味餐厅采用生蚝做新菜,我们也采用生蚝做新菜,则我们可以获得15%的客户。
如果用矩阵来表示上述选择,会更清晰:
从这个矩阵可以看出,无论海味餐厅的主厨做什么选择,对山珍餐厅来说,最好的策略都是选择用大闸蟹做新菜式。这时我们就说山珍餐厅的优势策略是选择大闸蟹做新菜式。
所谓优势策略,就是无论对方如何行动,采取优势策略带来的结果一定优于其他任何策略。如果拥有优势策略,那我们的选择就十分简单了:使用优势策略而不必担心对手如何行事。
但并不是所有的博弈中每个参与者都有优势策略,否则任何博弈都会变得很简单。更加复杂的博弈策略不是我们今天讨论的重点。我们只需要掌握基本的博弈法则,如尝试找找优势策略,就能提升在日常生活和工作中的决策效率以及决策效果。
博弈论的经典法则三:剔除所有劣势策略
优势策略能简化我们的行动规则,但我们说了并不是所有博弈都有优势策略。这时,我们可以从优势策略的对立面来考虑:
博弈论的经典法则三:剔除所有的劣势策略,不予考虑,如此一步一步做下去。
劣势策略就是劣于其他任何策略的策略。如果在博弈中你有一个劣势策略,就应该避免采用,同时你也应该清楚:如果你的对手有一个劣势策略,他也会避免采用。
剔除劣势策略的过程如果以一个唯一的结果告终,那就意味着已经找到了博弈的行动策略以及结果。但有时情况不会如此理想,剔除劣势策略后可能还有多个选择,但这个过程至少可以缩小博弈的规模,降低博弈的复杂程度。
利用法则二和法则三对博弈进行简化分析后,博弈的复杂程度会降到最低限度,但同时,我们也有可能会面临循环推理的问题,即你的最佳策略是以对手的最佳策略为基础,而反过来从对手方的角度分析也是如此。那怎样打破这个循环呢?
博弈论的经典法则四:找到均衡
打破上述循环的关键就是找到了一个策略组合,在这个组合中,各方的行动就是针对对方行动确定的最佳策略。一旦知道对方在做什么,没人会更改自己的做法。这就是我们前面提到的『纳什均衡』:
所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
纳什均衡引出了博弈论的最后一个经典法则:寻找这个博弈的均衡,即一对策略,按照这对策略行事,各个参与者的行动都是对对方行动的最佳回应。
“智猪博弈”是一个著名的纳什均衡的例子。
假设猪圈里有一头大猪、一头小猪。猪圈很长,一头有一个踏板,另一头是饲料的出口和食槽。每踩一下踏板,在远离踏板的猪圈另一头的饲料出口就会落下少量食物。如果小猪踩动踏板,大猪会在小猪跑到食槽之前吃光所有的食物;若是大猪踩动踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃剩下的食物。
这个博弈的均衡策略是什么呢?答案是:小猪选择“搭便车”策略,舒舒服服等在食槽边;大猪则为能吃到一点食物不知疲倦地奔忙于踏板和食槽之间。
需要注意的是,虽然我们说博弈的结果是均衡的,但这并不意味着结果就是对博弈参与者的最有利的结果。有利或者不利的评价属于另一个问题,答案视具体情况而各有不同。
理解并掌握以上关于博弈的五个法则,能让我们的决策做得更明智。如果小伙伴们对博弈论很感兴趣,推荐一本博弈论的经典:《策略思维:商界、政界及日常生活中的策略竞争》,有趣、有益、烧大脑。
----THE END----
至此,『那些让我们受益一生的经济学概念』系列已经全部发布完毕,你有什么收获吗?欢迎在留言区和大家一起分享。
『那些让我们受益一生的经济学概念』系列文章
本文:那些让我们受益一生的经济学概念之:博弈论
【为时未晚】关注个人成长与职业发展。开启全新的人生旅程,It's never too late.