TreNet：预测时序趋势

2018-05-23 本文已影响0人萧风萧雨

TreNet：预测时序趋势

时序趋势Trend指的是时间序列未来是上升还是下降趋势，通常包括趋势的幅度和持续时间。预测趋势可以用在资源分配，负载调度（如预测负载会变大时，提前增加资源配置来减少负载），股票交易等。其实这个问题也可以变成时序预测问题，预测得到未来的值就能知道未来是什么趋势，不过这样趋势的持续时间是固定的（因为预测的是未来某个时间的值）。
为了解决这个问题，论文Hybrid Neural Networks for Learning the Trend in Time Series，IJCAI-17提出了TreNet，一个端到端的网络，综合学习序列的局部和全局的特征来预测趋势。

Problem

时序趋势表示为持续时间duration和斜率slope，用<l_k, s_k>表示，如下图(c)所示：

图c是一个趋势序列，没有原始序列值信息，而只包含趋势信息的，用T来表示这个趋势序列T={<l_k, s_k>}。原始序列表示为X={x_1, x_2, ... , x_T}。所有的l_k加起来等与序列长度T
趋势序列表示的是时序的整体趋势信息，而没有局部的趋势信息，因此还需要考虑序列的局部具体信息，用L={<x_t(k-w), ..., x_t(k)>}表示，其中tk是trend k的结束时间，w是取的局部序列长度。
现在，问题的目标就是利用趋势序列T和局部序列L来预测未来的趋势<l_t+1, s_t+1>。可以用下图形象的说明：

左图是L，右图是T，然后预测t=100之后的趋势。

TreNet

TreNet使用RNN来捕捉趋势序列T的特征，CNN来捕捉局部序列L的特征，最后将两个特征融合得到未来趋势。整个框架如下图：

RNN用的是naive的LSTM，得到的特征用R(T)表示；
CNN用的是H层1-d卷积来提取局部特征，用C(L)表示；
特征融合，预测：

用W^r和Wc矩阵将两个特征映射到相同维度然后相加，经过一个element-wise leaky ReLU activation 函数，最后连接到输出层<l, s>。
Loss 函数：

实验

实验设置

Dataset：

Power Consumption(PC): 一个家庭电量的序列
Gas Sensor. 检测气体的传感器数据
Stock Transaction, Yahoo股票1950-10到2016-4

数据shuffle后分为10%用于测试，其他用于训练。
这里没有提一个序列的过去趋势是怎么确定的，后面我会看看探究怎么确定的，知道了就补充下。

Baseine：

CNN：使用的是原始序列来预测
LSTM：使用趋势序列来预测
ConvNet+LSTM：ConvNet提取序列特征，然后用LSTM预测
SVR：联合T和L作输入
Pattern-based hidden markov model(pHMM): 对序列分段然后用HMM建模序列段之间的依赖，然后根据预测时序的状态来决定评估未来趋势。
Naive：用上一trend预测。

（这里的LSTM是对趋势序列做预测的，我觉得应该增加一个使用原始序列来预测的，这里只有用CNN使用原始数据的。）

Metric
RMSE
训练
省略模型的具体参数.....

实验结果

对参数窗口大小w做了对比（这里只列出一个）：

从实验设置来看，这个窗口大小最小300，很大，这个应该是因为要预测未来的总体趋势，所以需要使用较大的局部序列。

总结

这篇论文用的方法都是很常见的了，不过做的问题是时序趋势预测，与传统预测未来某个时刻的值不一样，不过两者有很多共同的应用（都是对未来的预测）。这种预测方法的好处我觉得在于它利用了一个全局的趋势信息(T)，然后预测的目标多了一个持续时间。另外因为趋势是一个长时间的，所以这个是适用于长期的预测，如长期的投资等。

TreNet：预测时序趋势

TreNet：预测时序趋势

Problem

TreNet

实验

实验设置

实验结果

总结

猜你喜欢

热点阅读