博弈论概念

2024-05-05 本文已影响0人 HUZZAR

合作博弈：团体合作团体理性

非合作博弈：个人最优决策

静态博弈：同时进行石头剪子布

动态博弈：先后顺序后者可以知道前者的动作下棋

完全信息博弈：在博弈之前每个人都被告知规则但参与者不知道对方的选择囚徒困境

非完全信息博弈：参与者不了解对方的成本和风险汽车保险

完美信息博弈：参与者获得规则以及对手策略下棋

非完美信息博弈：同时做出策略参与者不知道对方的情况只能考虑各种情况然后做出最优选择

囚徒困境：二人非合作静态完全信息博弈

当每个人追求最大利益时社会才会达到它的最大利益？下面的例子证伪

A：同时承认每个人判20年

B：一人承认并且指认另一人的罪行另一人保持沉默抗拒承认承认者判5年沉默者判30年

C：都拒不承认两个判10年

存在结果：

合作背叛（对手）

合作 10/10 30/5

背叛 5/30 20/20

选择合作：可能10年可能30年

选择背叛：可能5年可能20年

对个体来说背叛是最优解当两个人都选择最优解结果是各判20年总体40年而团体的最优解是各判10年总体20年由此反证当每个人追求最大利益时社会不一定会达到它的最大利益

美苏争霸的囚徒困境：美国和苏联选择合作同时削减核武器开支对两方是最好的选择但是由于不确定对方的选择美苏同时选择背叛继续投入很多经费研究核武器最后导致苏联解体

反复博弈：硬币匹配

二人非合作静态完全信息博弈

合作背叛（对手）

合作 3/3 0/5

背叛 5/0 1/1

多次选择，得分制

一方全背叛一方全合作： 100:0

双方都背叛：20:20

双方都合作：60:60

一方随机一方全背叛：8:68

策略：一开始选择合作当对方出现背叛你的选择基于上一次对方的选择进行道德惩罚如果对方接受刺激重新回归合作这是最好的结果如果对方继续背叛你选择继续惩罚ta 但是如果对手的选择是随机性的则该策略会大打折扣

纳什均衡：每个人的策略都是对其他人策略的最优反应

合作背叛（对手）

合作 10/10 30/5

背叛 5/30 20/20

当对手选择合作的时候你的最优解是背叛 5<10

当对手选择背叛的时候你的最优解还是背叛 20<30

卢梭：《论人类不平等的起源和基础》中的猎鹿博弈

两个猎人获取鹿和兔子给的分值规则如下

🦌 🐰

🦌 2/2 0/1

🐰 1/0 1/1

如果只有一个纳什均衡点那么结果几乎可以预测

纳什均衡点指的是在一个博弈中，各参与者所选择的策略组合，使得每个参与者都没有动机单独改变自己的策略，考虑到其他参与者的选择。

在一个博弈中，如果每个参与者都采取了最优的策略，考虑到其他参与者的策略，那么这个策略组合就是一个纳什均衡点。在纳什均衡点上，没有参与者可以通过单独改变自己的策略来获得更好的结果。

多人博弈：

A B C三人，每人选择数字加合<=10 则每个人得到他们选择数字的分值如果最后加合>10 什么也得不到

example1: A/3 B/3 C/2 ，则各获得3/3/2分

example2: A/5 B/6 C/5，则都没有分数

A B C 假设ABC都是稳健型选手

round1 1 1 1

round2 2 2 2

round3 3 3 3

round4 3 4 4 超10🙅

round5 3 3/4 4/3

A B C 假设AB都是稳健型选手 C是大胆型选手

round1 1 1 6

round2 2 1 6

round3 2 2 6

round4 3 2 6 超10 🙅 AB重回小值不然什么都得不到

round5 2 2 6

A B C 假设AB都是稳健型选手但是A崇尚平等 C是大胆型选手

round1 1 1 6

round2 6 1 6 超10 🙅 A和C开始博弈

round3 3 2 4

round4 3 3 4

任何加合等于10的策略组合都是纳什均衡点多人博弈情况复杂不容易达到纳什均衡站在对方角度考虑问题能更快达到均衡点

多选择博弈（中位数原理）

假设社区选举从极左到极右分为1-10 10个等级每个等级有10张选票会投给思想相近的人如果相邻则两人平分选票

1 2 3 4 5 6 7 8 9 10

极左 < 中立 > 极右

case1 2个候选人思想相近选票平分

case2 2个候选人有不同的思想则有90种不同选择

A选择1 则B有9种选择 A一共有10种选择所以是9 x10 = 90种组合

假设A选择1 B选择2 则选票结果是10:90 2距离2-10比1距离3-10近选票会投给思想更接近的人以此类推

A1B2 > 10:90 A1B3 > 15:85 A1B4 > 20:80 ......A1B10 > 50:50 得出只要A选择1 则B最差也是打个平局所以不能选1或者10边缘选项同理2和9也不是好的选择继续排除2和9 3和8 4和7都不是好选择最后只剩5和6

1960年美国总统选举肯尼迪和尼克松都采取中位数原理结果选票得票率分别为49.7%和49.6%

上面是非常理想的模型每个等级都是10张选票但是现实是选票分布是不均等的

知己知彼百战不殆知道对方的想法才能做出自己的最优选择同时最优秀的参与者不但知道对方的分析方法甚至你还要知道对方对你的了解程度

声誉激励和伪装

兵者诡道也故能而示之不能用而示之不用近而示之远远而示之近

汽车修理厂 50%大修 50%小修

技术差的修理工直接大修利润较高

技术好的修理工根据情况进行大小修

车主怎么才能判断好的和差的修理工？查看修理记录总是大修的来判断好坏但是坏修理工知道后会进行伪装尽量减少大修增加小修偏离了真实的修车需求

海盗分脏中的三权分立思想

海岛分脏：假设5个海盗分脏 100斤黄金分法：编号1-5 当1号海盗分时剩下海盗表决如果达到一半的人同意则按照1号的分法分脏否则就把1号海盗扔进海里然后以此类推可能的结果

规则制定的权力与规则实施权力的分离立法权司法权行政权

智猪博弈：2只猪大猪和小猪有个杠杆一头食物推动石头砸动杠杆将食物提升到猪面前大小猪都可以推石头

A假设小猪推石头大猪在旁边等待则大猪能吃9份食物而小猪只能吃1份食物

B假设两只猪一起推石头则大猪能吃7份而小猪吃3份

C假设大猪推石头小猪在旁边等待则小猪能吃4份而大猪只能吃6份

前提：单独推石头会分别消耗2份食物能量如果一起推分别消耗1份食物能量

YES NO （小猪/YES表示推，NO表示不推）

YES 7-1:3-1 6-2:4

NO 9:1-2 0:0

无论大猪怎么选小猪选择不推都是最优解小猪不推的情况下所以大猪一定会去推

充分说明小资产阶级和大资产阶级在一个经济体中的关系

搭便车：许多中小型企业不会进行大规模的技术创新，而是采取跟随策略，等待大企业的新产品形成新的市场后，仿制大企业的新产品展开销售

责任与分工：大企业要有大企业的思维小企业有小企业的策略大企业承担更多责任

三个火枪手的博弈弱弱联合胜过强者

在Y字形路口三个火枪手相遇每个人都想射死对方但是每个人的射中率是不同的分别为：

A：70% B：60% C：50%

假设同时开枪：A会射B 因为B对他的威胁最大 B会射A 因为A对他的威胁最大 C会射A A对他的威胁最大在这种情况下 BC形成合力去射杀A 从死亡概率上来看 A为1-0.4x0.5 = 0.8 B为0.7 C为0 所以虽然射中率排行为ABC 但是A是最有可能死亡的

任何博弈中你需要知道对方的水平(理性非理性或者其他)去猜测对方有可能做出的决策同时也要知道对方对于你的了解程度

在博弈中弱小的那方可以拉拢同样弱小的那方以增加赢率

在博弈中弱小的那方趋向于消极选择损失小

博弈论概念

猜你喜欢

热点阅读