ARIMA模型
1. 白噪声 White Noise
如果一个时间序列是纯随机的,那么它就是白噪声。
可以用来表示这种时间序列,它的平均值是0,方差是常数,并且是一个不相关的随机变量。
这种序列的散点图表明不了任何模式,所以不可能预测这种序列未来的值。
2. 自回归模型 AutoRegressive Model (AR)
AR模型中只跟它过去的值等等有关:
通常来说,和它个过去的值有关的AR模型叫做AR(p)模型,像这样表示:
比如AR(0)就是,AR(1)就是。
3. 移动平均模型 Moving Average Model (MA)
移动平均模型中只跟随机误差项有关:
通常来说,和它个过去的值有关的MA模型叫做MA(q)模型,像这样表示:
比如MA(0)就是,MA(1)就是。
误差项就是平均值为0,方差是常数的白噪声。
4. 自回归移动平均模型 AutoRegressive Moving Average Model (ARMA)
这种模型是将AR和MA结合成ARMA(p,q)模型。
ARMA模型与个自己的过去的值和个过去的白噪声值有关:
时间序列的平稳性
严平稳 strictly stationary
如果在时间的边际分布在任意其他时间点都是相同的话,那么,并且与无关,(这里并且为任意整数),这样的时间序列被称为严平稳。这意味着的平均值、方差和协方差都是时不变的 (time invariant)。
弱平稳 weakly stationary
时间序列被称为弱平稳或者协方差平稳如果满足以下条件:
a)
b)
c)
5. 自回归整合移动平均模型 AutoRegressive Integrated Moving Average Model (ARIMA)
经过差分后,一个非平稳的时间序列可以变为平稳的时间序列。
一个经过一次差分后变为平稳的时间序列被称为整合了一次,表示为。
一般而言,被经过d次差分后变为平稳的时间序列被称为整合了d次,表示为。
所以,一个没有被经过差分就已经是平稳的时间序列表示为。
博克斯-詹金斯法 Box-Jenkins (B-J) methodology
对于单变量的时间序列模型的估计和预测可以使用博克斯-詹金斯法,主要分为三步:
(1) 识别 (2) 估计 (3) 诊断检测
B-J法只适用于平稳的变量,所以先要转换成平稳的时间序列。
1. 识别 identification
a) 自相关函数 Autocorrelation function (ACF)
自相关就是在一个时间序列中,观测点之间互相有关联。现在的观测点和个延迟lag之前的观测点有一个简单的相关性:
b) 偏自相关函数 Partial Autocorrelation function (PACF)
偏自相关用于测量当和之间其他的时间延迟1, 2, 3, ..., (p-1)的影响都被去除后的相关性。
c) 从ACF和PACF推断
理论上的ACF和PACF可以从不同的p和q得出,所以,比较不同pq下ACF和理论值,可以得出合适的ARIMA(p,q)模型。
理论上的ACF和PACF的性质如下表:
模型 | ACF | PACF
AR(p) | 突刺后衰减趋于0 | 突刺后截止为0
MA(q) | 突刺后截止为0 | 突刺后衰减趋于0
ARMA(p,q) | 突刺后衰减趋于0 | 突刺后衰减趋于0
2. 估计 estimation
主要借助于各种包进行估算得出p,q值
3. 诊断检测 diagnostic checking
a) 最小的AIC/BIC/SBIC值,这些值为最小的模型最好
b) 残差ACF图
如果残差的大部分自相关系数在和之间,N为观测点的数量,这样就可以得出残差是白噪声,也就是说模型是合适的。