深度学习

2020 时序分析(10)

2020-06-17  本文已影响0人  zidea
machine_learning.jpg

今天我们主要说时间序列的一些推导公式,之前看些资料,其中关于时间序列中常用AR模型、MA模型背后推导说的比较深,不易于理解。最近看了一些资料,适当地总结一些。

时间序列

时间序列虽然简单、但是要是想真正弄懂也需要花费一些功夫,将序列分解为一下形式。
X_t = T_t + S_t + R_t, t =1,2,\dots

这通过加法模型将这些项来表示时间序列,其中趋势项和季节项我们是可以通过模型来拟合,因为他们都是有规律可循的,需要我们能够通过模型学出来

\begin{aligned} GDP_t = GDP_{t-1}(1 + 0.07)^1\\ GDP_t = GDP_{t-2}(1 + 0.07)^2 \end{aligned}
GPD 就是一个趋势模型,而且是随着时间而不断成指数增长。

超市的人流,具有周期性,每周的人流在周末人流要相对于周一到周五人要多一些。每天人流下午要相对于上午人流要多一些。

X_t - T_t - S_t = R_t, t =1,2,\dots
那么也就是说明我们对 R_t ,我们之前讨论过时间序列是一个随机过程,也就是f(x_1,x_2,\dots,x_t) 的联合分布,通常我们研究一个联合分布是一个比较复制的问题。
这是我们在统计模型时候,最早的NPL 分析用到链式法则来表示联合概率一种
p(x_1)p(x_2|x_1)p(x_3|x_1,x_2)\dots p(x_n|x_{n -1},x_{n-2},\dots,x_1)
学习过概都知道条件概率,时序每一个时刻随机变量都是和他之前的随机时间点的概率是相关。这就是联合概率,要计算这个联合概率是需要相当大的计算量。

x_t = 0.8x_{t-1} + \epsilon_t

x_t = ax_{t-1} + \epsilon_t
当 a 小于 1 说明模型是稳定,反之说明模型是不稳定,为什么会有这样结论。我们可以结合小球的落地原理来项这个问题。
其实我们非齐次项差分方程
x_t - 0.8x_{t-1} = \epsilon_t
下面是差分方程通解
x_t - 0.8x_{t-1} = 0
Bx_t = x_{t-1}
其中 B 也即是滞后算子L,这里用 B 来表示,这里还是再演示一下吧
\begin{aligned} x_{t-1} = Bx_t \\ x_{t-2} = B^2x_t \\ \end{aligned}
x_t - 0.8Bx_t = \epsilon_t
接下来计算特征解,提取左边x_t
(I - 0.8B)x_t = \epsilon_t
x_t = (I - 0.8B)^{-1}\epsilon_t

\frac{1}{1 - 0.8Z}
\frac{1}{1-x} = \sum_{n=0}^{\infty} x^n = 1 + x+ x^2 + \dots x^n + ,|x|<1
可以表示无限变量只和形式,这个大家应该不会陌生,而且\frac{1}{1 + x} 类似\frac{1}{1 - 0.8Z},所以替换替换等比数列之和。
\begin{aligned} \frac{1}{1 - 0.8z} = \sum_{n=0}^{\infty}(0.8z)^n\\ (I - 0.8B)^{-1} = \sum_{n=0}^{\infty}(0.8B)^n \end{aligned}

x_t = \sum_{n=0}^{\infty}(0.8)^nB^n \epsilon_t = \sum_{n=0}^{\infty} 0.8 \epsilon_{t-n}

B^n\epsilon_t = (B,B\dots,B)\epsilon_t

重点相关性研究x_tx_{t-k}可以用a_1,\dots,a_p计算出来。AR序列相关性是随着负指数衰减,MA(q) 模型是有限相关性,
X_t = b_1 \epsilon_{t-1} + \dots + b \epsilon_{t-q} 有限时间序列相关(X_t,X_{t-q-1})=0

根据均方差最小原则,来进行预测
f(x_{t-1},\dots,x_{t-p}) = E(x_t|x_t\dots x_{t-p})
也就是我们讨论的AR模型,那么AR模型就可以用于时间序列分析
a_1x_{t-1} + \dots + a_p x_{t-p}

f(x_1,x_6,x_7) = f(x_2,x_7,x_8) 这样时间序列步长间隔相同间分布是一致,这样时间序列才是平稳的时间序列。线性filter

f(x) = \sum_{n=0}^{\infty} a_n \sin nx + \sum_{n=1}^{\infty} b_n \cos nx
这是研究时间序列另一种模型,通过频域来研究时间序列

x_t = a_1 x_{t-1} + \dots + a_p x_{t-p} + \epsilon_t

上一篇 下一篇

猜你喜欢

热点阅读