时间序列分析及预测

2021-08-28 本文已影响0人米斯特芳

本文是《商务与经济统计》一书的笔记。

时间序列的模式

水平模式

数据围绕一个不变的均值上下波动
平稳时间序列定义：数据有一个不变的均值；时间序列的变异性随时间推移不变

趋势模式

在一段较长的时间内，发生逐步的改变。按通常理解，就是整体上的一种趋势（过程中依然可能存在波动）。
对于趋势，可以去拟合它，比如线性拟合、曲线拟合

季节模式

由于“季节”影响，时间序列出现重复模式。此处“季节”指的是某种阶段，可以是季度，也可以是月份等。只是地球上季节的效应比较明显

趋势与季节模式

一般情况下，会同时存在趋势和季节模式，比如在出现重复模式的同时也出现趋势上升或下降的情况

循环模式

出现持续一年以上的在趋势线上下交替的点序列，则存在循环模式。通常与长期趋势影响合并，成为趋势循环影响，本章没有涉及到循环模式。

预测精度

这部分略，几个概念：预测误差、平均绝对误差MAE、均方误差MSE、平均绝对百分数误差MAPE

移动平均和指数平滑法

K阶移动平均

使用近K期数据的均值作为预测值： $F_{t+1}=\frac{Y_t+Y_{t-1}+...+Y_{t-k+1}}{k}$

加权移动平均

即赋予数据不同权重，权重总和为1.

指数平滑法

加权移动平均的一个特例，仅使用一个参数。 $F_{t+1}=\alpha Y_t+(1-\alpha)F_t$
如果时间序列波动太大，通常选择更小的平滑参数（即最近值权重低）

趋势推测法

略。这里就是简单的线性、非线性拟合了。

季节性和趋势

对于季节性数据建立方程时，需要采用虚拟变量，举个例子，有分季度的几年数据，设置3个虚拟变量（季度数-1）： $Q_1=\{\begin{aligned} 1，第一季度\\ 0，其他\\ \end{aligned} Q_2=\{\begin{aligned} 1，第二季度\\ 0，其他\\ \end{aligned} Q_3=\{\begin{aligned} 1，第三季度\\ 0，其他\\ \end{aligned}$
则一般季节性方程为： $\hat Y=b_0+b_1Q_1+b_2Q_2+b_3Q_3$

时间序列分解法

本章精髓。将一个时间序列分解出季节、趋势、不规则成分

加法模型

$Y_t=Trend_t+Seasonal_t+Irregular_t$
如果前期季节影响的规模与后期规模相同，则加法模型适合。否则应使用乘法模型。

乘法模型

$Y_t=Trend_t \times Seasonal_t \times Irregular_t$
其中趋势用被预测项目的单位衡量，其他按相对量衡量（数值大于1表示影响在趋势之上）。实践中，通常使用的就是乘法模型。

计算季节指数

原理：我们在预测的时候，一般是需要消除季节影响的（比如冬天棉袄卖的比夏天多，如果我们非要比较夏天和冬天棉袄的销量，则必需剔除季节影响才能比较），为了得到季节指数，需要从乘法模型中剔除趋势和不规则成分。得到季节指数后，我们再从原始数据中剔除季节影响，然后去做趋势拟合（趋势比较需要剔除季节影响），预测出的结果再乘以季节指数（预测是不需要剔除季节影响的）
讲下具体的步骤：

调整数据：因为各“季节”所含的天数可能是不一样的，直接比较不好，比如2月28天，3月31天，这样比较就不准确，所以通常做法是月销量除以该月天数，再乘以一年内平均每个月的天数
观察数据散点图、折线图，确定该用什么模型（默认可选择乘法模型）
计算季节指数：
3.1 计算移动平均数（以季节种类数作为窗口大小）
3.2 计算中心化移动平均数（因为1-4季度的平均数对应的是2.5季度，需要通过中心化消除小数点），得到趋势值
3.3 原始数据除以对应月份的趋势值，得到“季节-不规则值”
3.4 上面得到的值还含有不规则成分，所以对各季节分别求平均值，消除随机影响，此时得到的就是季节指数
3.5 调整季节指数：有时候季节指数总和/季节种类数不等于1，则需要缩放调整
得到季节指数后，先对原始数据除以季节指数
对消除季节影响的数据做趋势拟合，此时可进行比较性的任务
预测：通过趋势方程进行预测，得到的结果再乘以季节指数，还原为真实的预测值

一些附注

为什么不考虑循环成分

因为难。因为循环成分一般是长周期的，要获取足量的数据难，循环的周期长短不一也是难点。

计算季节指数的不同方法

在3.4中使用的是均值，也可以使用中位数等