2018-11-22 时间序列的简单思考(arima)
时间序列的四因素:趋势、周期、时期和不稳定因素
一、确定性时序分析(剔除了不稳定因素之后的分析)
1、趋势拟合法:
时间为自变量,对应的值为应变量,用最小二乘法拟合曲线。
回归方程可以是:
线性:yt = a1*t
非线性:yt = a1*t2 或者 yt = sin(t)
2、移动平滑法:
当前期等于前几期的加权和
公式:yt = a1*y(t-1) + a2*y(t-2)+...
3、指数平滑法:(短期预测)
https://blog.csdn.net/weixin_40396948/article/details/79108469
二、随机性变化分析(先贴基本的思路,之后再贴代码) arima模型
1、画出趋势图(如销量随时间的增长)
观察趋势图是否稳定,一般有明显趋势走势的都是不稳定的
q1:如何定量判断稳定性?
a1: Adf平稳检验(假设检验 假设有单位根):因为有单位根就意味着不稳定
1、检验随机过程的统计过程不随时间的推移而变化
2、Adf检验会返回五个值:分别是 t检验,p值检验,不同程度拒绝原假设的统计值(1% 5% 10%)
3、T值<(1% 5% 10%)的统计值,p值越接近于0,则越显著的拒绝原假设,说明该序列是稳定的
q2: 如何让序列变的稳定?
a2:使数据平稳的办法:
对数处理(log):使得序列变的更加线性,以便得到更好的差分效果
差分
平滑法
分解法:将时间序列分解为长期趋势 季节趋势 随机成分
*噪声检验:这一点有待查阅更多的资料
非白噪声的时间序列是可以用arma模型的
纯随机(白噪声)时间序列是无法用arma模型的
2、确定ar(p)和ma(q)模型
在序列稳定之后,需要思考得用上面模型来预测时间序列,这时候就需要画acf图(自相关系数图)和pacf图(偏自相关系数图),根据他们的拖尾和截尾性来选择合适的模型。
Ar:自回归模型
当前值可以根据过去某些值的线性组合(最小二乘mle) + 白噪声项
Ma:移动平均模型
自回归中的白噪声项,可以用之前几个时刻的白噪声线性表达(其实ma模型本身就是上面讲到的移动平滑法,只是在arma中他被用到了对时间序列的白噪声进行回归)
自相关系数:
自相关拖尾 是ar模型(p值)
偏自相关系数:
偏自相关拖尾 是ma模型(q值)
q3: 自相关系数和自回归中的拟合系数是不是一回事?
a3:不是 回归系数用最小二乘得到 n阶滞后自相关系数有自己的公式(acf)
q4:如何获得最好的(p,q)组合
a4:Bic/aic检验 选择这两个值最小(规则风险函数最小)的那个(p,q)组合
3、训练模型arima(p,d,q)
将模型回到原始形式 进行预测