《博弈论及其在无线通信网络中的应用》学习笔记
第一篇 博弈论概述
第一章 绪论
1.1 博弈论的定义
在一定规则约束条件下,各参与者基于所掌握的信息选择各自的策略以实现某一目标(可以是整体目标也可以是个体目标)。
[决策主体Decision Makers=参与者=局中人Players=主体Agents]
[注意]:
(1) 博弈论是多人决策理论,参与者有两个或两个以上。
(2) 理性人假设:每个参与者在决定采取哪种行动时,不但要根据自身的利益和目的行事,而且要考虑他的决策行为对其他参与者可能的影响,通过选择最佳行动来寻求收益最大化。
1.2 博弈的基本元素
1.参与者Player:i, -i
2.行动Action:
3.信息Information:参与者i拥有的其他参与者-i的行动或策略的知识,有关参与者i支付的知识。
4.策略Strategy:
[行动与策略的区别]:行动是具体的行为选择,指“怎么做”;策略是行动计划,指“如果对方怎么做我则怎么做”;策略空间是行动计划表,包含了所有“如果对方怎么做我则怎么做”。静态博弈中行动与策略可以混用。
5.支付/报酬Payoff:
6.理性Rationality:
7.目标Objective:
8.行动顺序:
9.结果Outcome:
10.均衡Equilibrium:指有所以参与者的最优策略所组成的组合,没有一个参与者能够通过独自采用其他策略而获得更多利益。
1.3 博弈论的分类
1.按行动先后顺序分:静态博弈/动态博弈
2.按信息结构分:完全信息博弈/不完全信息博弈
3.能否达成有约束力的合作协议分:合作博弈/非合作博弈
非合作并不是每个参与者拒绝和其他参与者合作,而是在非合作博弈中参与者只是根据其“可察觉的自身利益”来决策。
非合作的参与者虽然仅仅是由各自的私利所驱使,但在某些情况下却表现出合作的行为。
非合作博弈的核心问题是策略选择,研究参与者如何在利益相互影响的条件下做出最有利于自己的选择。合作博弈核心问题是利益分配,研究参与者已达成合作之后如何分配利益。
完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈都是非合作博弈。联盟博弈是合作博弈。
合作博弈:有中心的网络;非合作博弈:分布式网络。《无线网络中的博弈论》P8
4.零和/非零和博弈:
零和博弈:所有参与者的支付之和在任何情况下均为0。在该博弈中参与者的利益完全对立。
5.确定性微分博弈/随机微分博弈
时间不间断的动态博弈成为微分博弈;
确定性微分博弈:没有随机变量(元素),博弈中的状态变量和控制变量仅仅是时间t的函数,且都是确定的。
随机微分博弈:状态变量和控制变量不仅是时间t的函数,而且是随机变量的函数。
..........
..........
..........
未完待续