日更-《模型思维》34
2023-01-29 本文已影响0人
liumw1203
## 第27章 多播老虎机问题
多臂老虎机问题模型适用于各种各样的现实环境。
在收益不确定的行动之间进行的任何选择,无论是药物试验,还是对树立广告牌位置的选择、技术路线的选择,抑或是要不要允许在教室中使用笔记本电脑的决定,都可以建模为多臂老虎机问题。
如何选择一个可以出人头地的职业,也可以用多臂老虎机问题模型来建模。
>伯努利多臂老虎机问题
一个备选方案集{A,B,C,D,…,N}中的每一个备选方案都能够产生一个成功的结果,但是各自的概率{PA,PB,PC,PD,…,PN}都是未知的。在每一个时期,决策者选择一个备选方案K,并以概率PK得到一个成功的结果。
**最优规则:如果某个备选方案总能取得成功,那么就继续选择这个备选方案。增加实验可能没有任何价值,因为没有其他备选方案能够表现得更好。**