交通科研

深度学习(LSTM)在交通建模中的应用

2019-11-27  本文已影响0人  交通科研Lab

在简单了解了LSTM原理之后,本期我将以航班延误预测为例为大家介绍一下如何利用Python编程来构建LSTM模型。

这里我们要用到一个高级的深度学习链接库——Keras,它以TensorFlow或者Theano作为后端引擎,只处理模型的建立、训练和预测等功能,至于底层操作细节,Keras会帮你转化成Theano或TensorFlow相对指令。

Windows下用Anaconda安装Tensorflow和Keras

关于Tensorflow和Keras的安装,大家可以参考以下的博客。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议

本文链接:https://blog.csdn.net/lzy_shmily/article/details/80803433

需要注意的两点是:

利用Keras建立深度学习模型

利用Keras建立深度学习模型,就像在蛋糕架上面一层一层地插蛋糕。在这里,我们选择的“蛋糕架”是Sequential模型,它是多个神经网络层的线性堆叠。那么对于Sequential更多的信息,请参考Keras的中文官方文档(https://keras.io/zh/models/sequential/)。

构建LSTM模型来预测航班延误

接下来我们以航班延误预测为例来说明如何构建LSTM模型。

在航空领域,一架飞机每天要完成多个航班的飞行任务,这就形成了一个航班序列,如果飞机在一个航班任务中发生了延误,那该延误可能会沿着航班序列进行传播。

注:图片来源于网络。

当然,飞机也可能通过中途加速或者沿着直线飞行从而将延误抵消。那么我们在这里利用Python构建LSTM模型来预测一架飞机在下一个时刻的到港延误。

数据来源:美国交通部运输统计局提供的公开的航班数据

代码来源:https://www.evolutionarylearn.com/paper/python-keras-tensorflow-mts/

1 数据预处理

2 导入模块

3 建立****LSTM****类

LSTM类的基本框架是初始化,数据集分割,网络创建与训练,网络评估和结果可视化。

【初始化】

初始化主要是将基本的参数和数据导入进将要创建的实例。代码如下:

【数据集分割】

数据集分割包括两部分,一部分是特征选择,一部分是分割测试集和训练集。

这段代码中的测试集划分用的是test_data = self.dataset[train_size - self.look_back - 1:len(self.dataset), selected_list],为什么不是test_data = self.dataset[train_size :len(self.dataset), selected_list]呢?这个是为了保证测试集中有更多样本,后面一种会由于存在窗口损失掉一部分数据,减一应该是为了作图时连接训练部分和测试部分。

【网络创建】

开始在蛋糕架上插蛋糕~

【网络评估】

这里我们的评估指标选用的是R^2

【可视化】

4 导入参数

num_neur=[15, 10]表示这个LSTM网络有两个隐藏层,第一层的神经元个数为15,第二层的神经元个数为10;select_feature = [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]表示我选择了数据集中所有的特征,不选择的设为0就好。所选特征包括:到港延误、季度、周几、出发机场、到达机场、计划和实际运行时间、距离、在空时间、计划过站时间、到达机场每小时的计划离港流量和计划到港流量。

5 程序运行结果

【网络结构】

【拟合网络、训练和测试结果】

我们创建和拟合LSTM网络所需的时间为225.81秒,训练集的[图片上传失败...(image-bf1aa3-1574838007274)] 值为0.55,测试集的[图片上传失败...(image-245725-1574838007274)] 值为0.44,可以看出,模型的预测结果并不是很好,因为这里我们并没有对超参数进行选择,而且航班延误的一个很重要的影响因素——天气的相关数据我们并没有加进去。

本期结语

到这里,LSTM网络的理论及其在交通建模中的应用的相关介绍就全部结束了。

如果你有问题和不同的看法,可以在评论区留言,我们互相交流,互相学习,共同进步~

什么,你们觉得没看够啊???

那就关注我们的公众号吧!

【交通科研Lab】

致力于

“分享学习点滴,期待科研交流!”

上一篇下一篇

猜你喜欢

热点阅读