天猫双十一成交额是如何预测的

2020-12-16  本文已影响0人  可乐的数据分析之路

首发于公众号:可乐的数据分析之路

2020年淘宝双十一成交额4982亿,要知道2019年是2684亿,猛地一瞅,好牛,但总量越来越大的同时增长率却逐年降低呀,且今年的统计口径和历年都不一样(后面会说统计口径的问题)。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

其实早在2019年双十一前,网友们就开始讨论双十一数据造假的问题了,有网友对历年数据进行拟合并且成功预测19年的成交额,结果都高度吻合。


image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

今天我们主要是借着双十一成交额这个数据来聊一聊时间序列分析的问题

时间序列,顾名思义,就是数据随时间变化

时间序列进行预测的关键,是确定已有时间序列的变化模式,并假定这种模式会延续到未来

名词解释

时间序列:数据随时间变化的形式

经济数据大多呈时间序列的形式,如历年淘宝双十一成交额

一个时间序列的变化通常可以由以下4种成分组成:

想要确定一个时间序列是否包含趋势成分,可对数据进行回归分析,得到拟合的趋势线,并进行显著性检验,通过检验,则说明线性趋势显著

想要确定一个时间序列是否包含季节性的成分,需要至少两年的数据,

做时间序列分析最关键的就是一个假设,假设现在的这种变化趋势会延续到未来

下面介绍几种时间序列预测的方法

平滑预测法

只含有随机成分,不存在趋势或季节性成分的可用该方法,平滑预测法包含简单平均法、移动平均法、指数平滑法,通过平滑就可以消除随机波动

简单平均法

以一定观察期的数据求得平均数,并以所求平均数为基础,预测未来时期的预测值。简易平均法是最简单的定量预测方法

如下图用简单平均法预测2020年淘宝双十一交易额

因为近期的数值远比远期的数值更有作用,因此这样预测的结果是不够准确的。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

移动平均法

移动平均法就是利用近期的数据来预测未来的方法,也可以细分成两种方法,简单移动平均法和加权移动平均法。

简单移动平均法是将最近期的数据平均后最为下一期的预测值

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

可以用Excel来做
进入路径:数据——数据分析——移动平均
输入:输入数据源
间隔:指定使用几组数据来得出平均值,即公式中的n,移动个数。
输出:确定输出区域以及图表

还是双十一数据,可以取间隔为3和2时分别计算一下看看。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

需要注意的是:

指数平滑法

指数平滑法是对观察值进行加权从而进行预测的一种方法,通过对不同时间的观察值所赋予的权数不等,从而加大了近期观察值的权数,使预测值能够迅速反映市场实际的变化。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

Excel里也有指数平滑的方法
路径:数据——数据分析——指数平滑,注意这里填的是阻尼系数


image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

趋势序列预测

当序列存在明显的趋势时,就不再适用上述方法了,应用趋势序列预测的方法。

线性趋势

呈现出增长/下降的线性变化趋势,有点回归分析那味儿了,可以用Excel里的趋势线来预测,选择线性趋势,勾上显示公式和R平方,代入线性公式,得到2020预测值。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

非线性趋势

其实这个淘宝双十一的数据我们很明显地看出来它是呈指数递增的,那就在趋势线里选择指数,得到指数曲线的预测方程,代入公式预测2020年数据,可以看到误差还是挺大的。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

可以用二项式来预测,可以看到R方为0.9996,说明拟合效果不错,比线性和指数都要好,把公式代入得到2020年预测值为3280,阿里官方的统计口径是11.1日至11月11日0.30分累积3723亿,最终的成交金额为4982亿。

这里有个统计口径的问题,之前几年的数据都是当天的成交额,而2020年则变成了11月1日~11日的累积成交额,再结合增长率看看,说明什么呢?大家心知肚明就好了哈。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

上一篇下一篇

猜你喜欢

热点阅读