ARIMA模型

2019-02-19  本文已影响0人  拯救大圈仔

1. 白噪声 White Noise

如果一个时间序列是纯随机的,那么它就是白噪声。

可以用\varepsilon_{t} 来表示这种时间序列,它的平均值是0[E(\varepsilon _{t} )=0],方差是常数[V(\varepsilon _{t} )=\sigma ^2],并且是一个不相关的随机变量[E(\varepsilon _{t}\varepsilon _{s})=0]

这种序列的散点图表明不了任何模式,所以不可能预测这种序列未来的值。

2. 自回归模型 AutoRegressive Model (AR)

AR模型中Y_t只跟它过去的值Y_{t-1},Y_{t-2},Y_{t-3}等等有关:

Y_{t}=f(Y_{t-1},Y_{t-2},Y_{t-3},...,\varepsilon _t)

通常来说,和它p个过去的值有关的AR模型叫做AR(p)模型,像这样表示:

Y_{t}=\beta _{0}+\beta _{1}Y_{t-1}+\beta _{2}Y_{t-2}+\beta _{3}Y_{t-3}+...+\beta _pY_{t-p}+\varepsilon _t

比如AR(0)就是Y_t=\beta _0+\varepsilon _t,AR(1)就是Y_t=\beta_0+\beta_1Y_{t-1}+\varepsilon _t

3. 移动平均模型 Moving Average Model (MA)

移动平均模型中Y_t只跟随机误差项有关:

Y_t=f(\varepsilon _t,\varepsilon_{t-1},\varepsilon_{t-2},\varepsilon_{t-3},...)

通常来说,和它q个过去的值有关的MA模型叫做MA(q)模型,像这样表示:

Y_t=\beta_0+\varepsilon_t+\phi _1\varepsilon_{t-1}+\phi_2\varepsilon_{t-2}+\phi_3\varepsilon_{t-3}+...+\phi_q\varepsilon_{t-q}

比如MA(0)就是Y_{t}=\beta_0+\varepsilon_t,MA(1)就是Y_t=\beta_0+\varepsilon_t+\phi_1\varepsilon_{t-1}

误差项\varepsilon _t就是平均值为0,方差是常数\sigma ^2的白噪声。

4. 自回归移动平均模型 AutoRegressive Moving Average Model (ARMA)

这种模型是将AR和MA结合成ARMA(p,q)模型。

ARMA模型与p个自己的过去的值和q个过去的白噪声值有关:

Y_t=\beta_0+\beta_1Y_{t-1}+\beta_2Y_{t-2}+\beta_3Y_{t-3}+...+\beta_pY_{t-p}+\varepsilon_t+\phi_1\varepsilon_{t-1}+\phi_2\varepsilon_{t-2}+\phi_3\varepsilon_{t-3}+...+\phi_q\varepsilon_{t-q}

时间序列的平稳性

严平稳 strictly stationary

如果Y在时间t的边际分布p(Y_t)在任意其他时间点都是相同的话,那么p(Y_t)=p(Y_{t+k}),并且p(Y_t,Y_{t+k})t无关,(这里t\geq  1并且k为任意整数),这样的时间序列被称为严平稳。这意味着Y_t的平均值、方差和协方差都是时不变的 (time invariant)。

弱平稳 weakly stationary

时间序列被称为弱平稳或者协方差平稳如果满足以下条件:

a) E(Y_1)=E(Y_2)=E(Y_3)=...=E(Y_t)=\mu (常数)

b) Var(Y_1)=Var(Y_2)=Var(Y_3)=...=Var(Y_t)=\gamma _0(常数)

c) Cov(Y_1,Y_{1+k})=Cov(Y_2,Y_{2+K})=Cov(Y_3,Y_{3+k})=\gamma _k(和延迟k有关)

5. 自回归整合移动平均模型 AutoRegressive Integrated Moving Average Model (ARIMA)

经过差分后,一个非平稳的时间序列可以变为平稳的时间序列。

一个经过一次差分后变为平稳的时间序列被称为整合了一次,表示为I(1)

一般而言,被经过d次差分后变为平稳的时间序列被称为整合了d次,表示为I(d)

所以,一个没有被经过差分就已经是平稳的时间序列表示为I(0)

博克斯-詹金斯法 Box-Jenkins (B-J) methodology

对于单变量的时间序列模型的估计和预测可以使用博克斯-詹金斯法,主要分为三步:

(1) 识别 (2) 估计 (3) 诊断检测

B-J法只适用于平稳的变量,所以先要转换成平稳的时间序列。

1. 识别 identification

a) 自相关函数 Autocorrelation function (ACF)

自相关就是在一个时间序列中,观测点之间互相有关联。现在的观测点Y_tp个延迟lag之前的观测点Y_{t-p}有一个简单的相关性:

\rho _k=Corr(Y_t,Y_{t-p})=\frac{Cov(Y_t,Y_{t-p})}{\sqrt{var(Y_t)}\sqrt{var(Y_t-p)} }=\frac{\gamma _p}{\gamma _0}

b) 偏自相关函数 Partial Autocorrelation function (PACF)

偏自相关用于测量当Y_tY_{t-p}之间其他的时间延迟1, 2, 3, ..., (p-1)的影响都被去除后的相关性。

c) 从ACF和PACF推断

理论上的ACF和PACF可以从不同的p和q得出,所以,比较不同pq下ACF和理论值,可以得出合适的ARIMA(p,q)模型。

理论上的ACF和PACF的性质如下表:

模型           |    ACF                        |    PACF

AR(p)         |  突刺后衰减趋于0      |  突刺后截止为0

MA(q)         |  突刺后截止为0         |  突刺后衰减趋于0

ARMA(p,q) | 突刺后衰减趋于0      | 突刺后衰减趋于0

2. 估计 estimation

主要借助于各种包进行估算得出p,q值

3. 诊断检测 diagnostic checking

a) 最小的AIC/BIC/SBIC值,这些值为最小的模型最好

b) 残差ACF图

如果残差的大部分自相关系数在-1.96/\sqrt{N}+1.96/\sqrt{N}之间,N为观测点的数量,这样就可以得出残差是白噪声,也就是说模型是合适的。

上一篇下一篇

猜你喜欢

热点阅读