想法简友广场心理

数学建模:马尔科夫决策过程

2022-04-09  本文已影响0人  Cache_wood

@[toc]

设随机过程X_n(n\in T)的时间集合T = \{1,2,3,…\},状态空间 E = \{1,2,3…N\},即 X_n (n\in T) 是时间离散、状态离散的随机过程。若对任意的整数n\in T ,满足P\{X_{n+1} = x_{n+1}|X_n=x_n,…,X_0=x_0\} =P\{X_{n+1}=x_{n+1}|X_n=x_n\}。则称X_n(n\in T)为马尔可夫链,简称马氏链。上式称为过程的马尔可夫性或无后效性

P_{ij}(n_m,n_{m+k})n_m无关,即转移概率只与出发状态、转移步数、到达状态相关
p_{ij}(k) =p\{X(n_{m+k})=j|X(n_m)=i\},k\geq 1\\ 一步转移概率:P_{ij}(1) \leftrightarrow p_{ij}


可以证明:k步转移概率矩阵为一步转移概率矩阵的k次幂。
[p_{ij}(k)]_{N\times N} = [p_{ij}]^k
若存在m为正整数,概率矩阵P的m次幂P^m 的所有元素皆为正,则P称为正规概率矩阵

若任意的i,j\in S:\lim_{m\rightarrow +\infty}p_{ij}^{(m)} = \pi_j,则称\pi = (\pi_1,\pi_2,…,\pi_N)为稳态分布。

设存在稳态分布\pi = (\pi_1,\pi_2,…,\pi_N),则由于下式恒成立:P(k) = P(k-1)P,令k\rightarrow \infty就得\pi = \pi P

例:某地区有甲、乙、丙三家药厂生产板蓝根,有1600个用户,假定在研究期间无新用户加入也无老用户退出,只有用户的转移。已知 8月份有480 户是甲厂的顾客;320 户是乙厂的顾客;800户是丙厂的顾客。9 月份,甲厂的顾客有 48 户转
乙厂,96户转丙厂;乙厂的顾客有32户转甲厂,64户转丙厂;丙厂有的顾客有 64户转甲厂,32户转乙厂。假设顾客保持相同的流转,请预测
(1)这三家药厂在10月和11月的顾客人数,

(2)稳态时市场的占有率。

从-到 合计
336 48 96 480
32 224 64 320
并丙 224 32 704 800
合计 432 304 864 1600

状态转移概率矩阵:
P = \left[\begin{array}{cc}0.7 & 0.1 & 0.2\\0.1& 0.7 &0.2\\0.08& 0.04 &0.88\end{array}\right]
9月份的状态向量为(432,304,864),由
\left(\begin{array}{cc}432& 304 & 864\end{array}\right) \left[\begin{array}{cc}0.7 & 0.1 & 0.2\\0.1& 0.7 &0.2\\0.08& 0.04 &0.88\end{array}\right] = \left[\begin{array}{cc}402\\291\\908\end{array}\right]
可预测,10月份,甲、乙、丙三家的顾客数分别为(402,291,908)。

同理,
\left(\begin{array}{cc}402& 291 & 908\end{array}\right) \left[\begin{array}{cc}0.7 & 0.1 & 0.2\\0.1& 0.7 &0.2\\0.08& 0.04 &0.88\end{array}\right] = \left[\begin{array}{cc}383\\280\\937\end{array}\right]
可预测,11月份,甲、乙、丙三厂的顾客数分别为383、280、937。

xP=x,(P-E)^Tx^T = 0,\sum x = 1

求得稳态分布:x^*= (0.2187,0.1563,0.6250)

所以三家药厂在均衡时的市场占有率分别是:甲22%,乙16%,丙62%。

上一篇下一篇

猜你喜欢

热点阅读