博弈论概念

2024-05-05  本文已影响0人  HUZZAR

合作博弈:团体合作 团体理性

非合作博弈:个人最优决策

静态博弈:同时进行 石头剪子布

动态博弈:先后顺序 后者可以知道前者的动作 下棋

完全信息博弈:在博弈之前每个人都被告知规则 但参与者不知道对方的选择 囚徒困境

非完全信息博弈:参与者不了解对方的成本和风险 汽车保险

完美信息博弈:参与者获得规则 以及对手策略 下棋

非完美信息博弈:同时做出策略 参与者不知道对方的情况 只能考虑各种情况 然后做出最优选择

囚徒困境:二人 非合作 静态 完全信息博弈

当每个人追求最大利益时 社会才会达到它的最大利益?下面的例子证伪

A:同时承认 每个人判20年

B:一人承认并且指认另一人的罪行 另一人保持沉默抗拒承认 承认者判5年 沉默者判30年

C:都拒不承认 两个判10年

存在结果:

                  合作              背叛            (对手)      

合作        10/10             30/5

背叛         5/30              20/20

选择合作:可能10年 可能30年

选择背叛:可能5年 可能20年

对个体来说 背叛是最优解 当两个人都选择最优解 结果是各判20年总体40年 而团体的最优解是各判10年总体20年 由此反证当每个人追求最大利益时 社会不一定会达到它的最大利益

美苏争霸的囚徒困境:美国和苏联选择合作 同时削减核武器开支对两方是最好的选择 但是由于不确定对方的选择 美苏同时选择背叛 继续投入很多经费研究核武器 最后导致苏联解体

反复博弈:硬币匹配

二人 非合作 静态 完全信息博弈

                合作              背叛        (对手)      

合作        3/3                 0/5

背叛        5/0                 1/1

多次选择,得分制

一方全背叛 一方全合作: 100:0

双方都背叛:20:20

双方都合作:60:60

一方随机 一方全背叛:8:68

策略:一开始选择合作 当对方出现背叛 你的选择基于上一次对方的选择 进行道德惩罚 如果对方接受刺激 重新回归合作 这是最好的结果 如果对方继续背叛 你选择继续惩罚ta 但是如果对手的选择是随机性的 则该策略会大打折扣

纳什均衡:每个人的策略都是对其他人策略的最优反应

                 合作              背叛         (对手)      

合作        10/10             30/5

背叛         5/30              20/20

当对手选择合作的时候 你的最优解是背叛    5<10

当对手选择背叛的时候 你的最优解还是背叛  20<30

卢梭:《论人类不平等的起源和基础》中的猎鹿博弈

两个猎人 获取鹿和兔子给的分值规则如下

                 🦌                   🐰

🦌            2/2                   0/1

🐰            1/0                   1/1

如果只有一个纳什均衡点 那么结果几乎可以预测

纳什均衡点指的是在一个博弈中,各参与者所选择的策略组合,使得每个参与者都没有动机单独改变自己的策略,考虑到其他参与者的选择。

在一个博弈中,如果每个参与者都采取了最优的策略,考虑到其他参与者的策略,那么这个策略组合就是一个纳什均衡点。在纳什均衡点上,没有参与者可以通过单独改变自己的策略来获得更好的结果。

多人博弈:

A B C三人, 每人选择数字 加合<=10 则每个人得到他们选择数字的分值 如果最后加合>10 什么也得不到

example1: A/3 B/3 C/2 ,则各获得3/3/2分

example2: A/5 B/6 C/5,则都没有分数

                  A        B       C      假设ABC都是稳健型选手

round1      1        1       1

round2       2       2       2

round3       3       3       3

round4       3       4       4    超10🙅  

round5       3     3/4    4/3

                  A        B       C      假设AB都是稳健型选手 C是大胆型选手

round1      1        1       6

round2       2       1       6

round3       2       2       6

round4       3       2       6    超10 🙅 AB重回小值 不然什么都得不到

round5       2       2       6

                   A        B       C      假设AB都是稳健型选手 但是A崇尚平等 C是大胆型选手

round1      1        1       6

round2       6       1       6    超10 🙅 A和C开始博弈

round3       3       2       4

round4       3       3       4    

任何加合等于10的策略组合都是纳什均衡点 多人博弈情况复杂不容易达到纳什均衡 站在对方角度考虑问题 能更快达到均衡点

多选择博弈(中位数原理)

假设社区选举 从极左到极右分为1-10 10个等级 每个等级有10张选票会投给思想相近的人 如果相邻则两人平分选票

1      2      3      4      5     6     7     8     9    10

极左          <           中立           >               极右

case1 2个候选人思想相近  选票平分

case2 2个候选人有不同的思想 则有90种不同选择 

A选择1 则B有9种选择 A一共有10种选择 所以是9 x10 = 90种组合

假设A选择1 B选择2 则选票结果是10:90 2距离2-10比1距离3-10近 选票会投给思想更接近的人 以此类推 

A1B2 > 10:90  A1B3 > 15:85  A1B4 > 20:80 ......A1B10 > 50:50 得出只要A选择1 则B最差也是打个平局 所以不能选1或者10边缘选项 同理2和9也不是好的选择 继续排除2和9 3和8 4和7都不是好选择 最后只剩5和6

1960年美国总统选举 肯尼迪和尼克松都采取中位数原理 结果选票得票率分别为49.7%和49.6% 

上面是非常理想的模型 每个等级都是10张选票 但是现实是选票分布是不均等的 

知己知彼 百战不殆 知道对方的想法 才能做出自己的最优选择 同时最优秀的参与者不但知道对方的分析方法 甚至你还要知道对方对你的了解程度

声誉激励和伪装

兵者 诡道也 故能而示之不能 用而示之不用 近而示之远 远而示之近

汽车修理厂 50%大修 50%小修 

技术差的修理工直接大修 利润较高

技术好的修理工根据情况进行大小修

车主怎么才能判断好的和差的修理工? 查看修理记录 总是大修的来判断好坏 但是坏修理工知道后会进行伪装 尽量减少大修 增加小修 偏离了真实的修车需求 

海盗分脏中的三权分立思想

海岛分脏:假设5个海盗分脏 100斤黄金 分法:编号1-5 当1号海盗分时 剩下海盗表决如果达到一半的人同意 则按照1号的分法分脏 否则就把1号海盗扔进海里 然后以此类推 可能的结果

规则制定的权力与规则实施权力的分离 立法权 司法权 行政权

智猪博弈:2只猪 大猪和小猪 有个杠杆一头食物 推动石头砸动杠杆将食物提升到猪面前 大小猪都可以推石头 

A假设小猪推石头 大猪在旁边等待 则大猪能吃9份食物 而小猪只能吃1份食物 

B假设两只猪一起推石头 则大猪能吃7份 而小猪吃3份

C假设大猪推石头 小猪在旁边等待 则小猪能吃4份 而大猪只能吃6份

前提:单独推石头会分别消耗2份食物能量 如果一起推分别消耗1份食物能量

                   YES                     NO         (小猪/YES表示推,NO表示不推)

YES          7-1:3-1              6-2:4

NO             9:1-2                   0:0

无论大猪怎么选 小猪选择不推都是最优解 小猪不推的情况下 所以大猪一定会去推 

充分说明小资产阶级和大资产阶级在一个经济体中的关系

搭便车:许多中小型企业不会进行大规模的技术创新,而是采取跟随策略,等待大企业的新产品形成新的市场后,仿制大企业的新产品展开销售

责任与分工:大企业要有大企业的思维 小企业有小企业的策略 大企业承担更多责任

三个火枪手的博弈 弱弱联合胜过强者

在Y字形路口三个火枪手相遇 每个人都想射死对方 但是每个人的射中率是不同的 分别为:

A:70%      B:60%      C:50%

假设同时开枪:A会射B 因为B对他的威胁最大 B会射A 因为A对他的威胁最大 C会射A A对他的威胁最大 在这种情况下 BC形成合力去射杀A 从死亡概率上来看 A为1-0.4x0.5 = 0.8 B为0.7 C为0 所以虽然射中率排行为ABC 但是A是最有可能死亡的

任何博弈中 你需要知道对方的水平(理性非理性或者其他)去猜测对方有可能做出的决策 同时也要知道对方对于你的了解程度

在博弈中 弱小的那方可以拉拢同样弱小的那方以增加赢率

在博弈中 弱小的那方趋向于消极选择 损失小

上一篇下一篇

猜你喜欢

热点阅读