时间序列数据
01|时间序列定义:
时间序列是按照一定的时间间隔排列的一组数据,其时间间隔可以是任意的时间单位,如小时、日、周月等。比如,不同时间段某产品的用户数量,以及某个在网站的用户行为,这些数据形成了以一定时间间隔的数据。
人们希望通过对这些时间序列的分析,从中发现和揭示现象发展变化的规律,尽可能多地从中提取所需要的信息,并将这些知识和信息用于预测,以掌握和预测未来行为。对于时间序列的预测,由于很难确定它与其他变量之间的关系,这时我们就不能用回归去预测,而应使用时间序列方法进行预测。
采用时间序列分析进行预测时需要一系列的模型,这种模型称为时间序列模型。在使用这种模型时,总是假定某一种数据变化趋势是会重复发生的。
02|时间序列分析的用途:
系统描述,根据对系统进行观测得到的时间序列数据,用曲线进行拟合,得到客观的描述;比如2017年A产品销量的时间序列曲线是逐渐上涨的一个趋势。
系统分析,当观测值取自于两个以上的变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,以此来说明两个变量随时间的变化情况;典型的例子就是,随着时间推移,新上市产品A的销量逐渐上涨,B产品销量逐渐下滑。
预测未来,通过对过去的时间序列数据进行拟合,预测未来某一时间段的数据;典型的销量预测。
决策和控制,根据时间序列模型可调整输入变量使系统发展过程保持一个持续上升的状态,预测到要偏离目标值时进行及时控制;典型的拿用户生命周期来说,尽可能缩短用户的成长周期,尽可能的延迟用户衰退期的到来。
03|时间序列的组成因素:
时间序列的变化受多种因素的影响,我们将众多影响因素按照对现象变化影响的类型,以揭示时间序列的变动规律性,划分成如下几种因素:
趋势性,指现象随着时间的推移朝着一定方向呈现出持续上升、下降或平稳的变化或移动。
周期性,指现象随着时间序列的变化呈现出周期性的变化,就像正余弦函数那样。
不规则变化,指现象受偶然因素的影响而呈现出不规则的波动。
04|时间序列的分类:
按所研究对象的多少分,有一元时间序列和多元时间序列。如果某种产品一年的销量数据数据就是一元序列;如果研究的序列不仅仅是一个数列,而是多个变量,即一个时间点对应多个变量时,这种序列称为多元时间序列,比如一天中某一时刻的气温、气压和雨量。
按时间的连续性分,可将时间序列分为离散型时间序列和连续时间序列。
按序列的统计特性分,有平稳时间序列和非平稳时间序列,所谓平稳就是随着时间的推移,数据并未发生大的波动。
按序列的分布规律分,有高斯型和非高斯型时间序列两种。