时间序列分析及预测

2021-08-28  本文已影响0人  米斯特芳

本文是《商务与经济统计》一书的笔记。

时间序列的模式

水平模式

数据围绕一个不变的均值上下波动
平稳时间序列定义:数据有一个不变的均值;时间序列的变异性随时间推移不变

趋势模式

在一段较长的时间内,发生逐步的改变。按通常理解,就是整体上的一种趋势(过程中依然可能存在波动)。
对于趋势,可以去拟合它,比如线性拟合、曲线拟合

季节模式

由于“季节”影响,时间序列出现重复模式。此处“季节”指的是某种阶段,可以是季度,也可以是月份等。只是地球上季节的效应比较明显

趋势与季节模式

一般情况下,会同时存在趋势和季节模式,比如在出现重复模式的同时也出现趋势上升或下降的情况

循环模式

出现持续一年以上的在趋势线上下交替的点序列,则存在循环模式。通常与长期趋势影响合并,成为趋势循环影响,本章没有涉及到循环模式。

预测精度

这部分略,几个概念:预测误差、平均绝对误差MAE、均方误差MSE、平均绝对百分数误差MAPE

移动平均和指数平滑法

K阶移动平均

使用近K期数据的均值作为预测值:F_{t+1}=\frac{Y_t+Y_{t-1}+...+Y_{t-k+1}}{k}

加权移动平均

即赋予数据不同权重,权重总和为1.

指数平滑法

加权移动平均的一个特例,仅使用一个参数。F_{t+1}=\alpha Y_t+(1-\alpha)F_t
如果时间序列波动太大,通常选择更小的平滑参数(即最近值权重低)

趋势推测法

略。这里就是简单的线性、非线性拟合了。

季节性和趋势

对于季节性数据建立方程时,需要采用虚拟变量,举个例子,有分季度的几年数据,设置3个虚拟变量(季度数-1):Q_1=\{\begin{aligned} 1,第一季度\\ 0,其他\\ \end{aligned} Q_2=\{\begin{aligned} 1,第二季度\\ 0,其他\\ \end{aligned} Q_3=\{\begin{aligned} 1,第三季度\\ 0,其他\\ \end{aligned}
则一般季节性方程为:\hat Y=b_0+b_1Q_1+b_2Q_2+b_3Q_3

时间序列分解法

本章精髓。将一个时间序列分解出季节、趋势、不规则成分

加法模型

Y_t=Trend_t+Seasonal_t+Irregular_t
如果前期季节影响的规模与后期规模相同,则加法模型适合。否则应使用乘法模型

乘法模型

Y_t=Trend_t \times Seasonal_t \times Irregular_t
其中趋势用被预测项目的单位衡量,其他按相对量衡量(数值大于1表示影响在趋势之上)。实践中,通常使用的就是乘法模型。

计算季节指数

原理:我们在预测的时候,一般是需要消除季节影响的(比如冬天棉袄卖的比夏天多,如果我们非要比较夏天和冬天棉袄的销量,则必需剔除季节影响才能比较),为了得到季节指数,需要从乘法模型中剔除趋势和不规则成分。得到季节指数后,我们再从原始数据中剔除季节影响,然后去做趋势拟合(趋势比较需要剔除季节影响),预测出的结果再乘以季节指数(预测是不需要剔除季节影响的)
讲下具体的步骤:

  1. 调整数据:因为各“季节”所含的天数可能是不一样的,直接比较不好,比如2月28天,3月31天,这样比较就不准确,所以通常做法是月销量除以该月天数,再乘以一年内平均每个月的天数
  2. 观察数据散点图、折线图,确定该用什么模型(默认可选择乘法模型)
  3. 计算季节指数:
    3.1 计算移动平均数(以季节种类数作为窗口大小)
    3.2 计算中心化移动平均数(因为1-4季度的平均数对应的是2.5季度,需要通过中心化消除小数点),得到趋势值
    3.3 原始数据除以对应月份的趋势值,得到“季节-不规则值”
    3.4 上面得到的值还含有不规则成分,所以对各季节分别求平均值,消除随机影响,此时得到的就是季节指数
    3.5 调整季节指数:有时候季节指数总和/季节种类数不等于1,则需要缩放调整
  4. 得到季节指数后,先对原始数据除以季节指数
  5. 对消除季节影响的数据做趋势拟合,此时可进行比较性的任务
  6. 预测:通过趋势方程进行预测,得到的结果再乘以季节指数,还原为真实的预测值

一些附注

为什么不考虑循环成分

因为难。因为循环成分一般是长周期的,要获取足量的数据难,循环的周期长短不一也是难点。

计算季节指数的不同方法

在3.4中使用的是均值,也可以使用中位数等

上一篇 下一篇

猜你喜欢

热点阅读