大数据,机器学习,人工智能数据分析机器学习与数据挖掘

论文 | 从商用车队的 GPS 数据中归类车辆停留意图信息

2018-06-19  本文已影响23人  Kofe_

原文:Stop purpose classification from GPS data of commercial vehicle fleets
作者:Sarti L, Bravi L, Sambo F.
来源:Data Mining Workshops, 2017 IEEE International Conference on. IEEE, 2017: 280-287.
转载:简书不支持公式渲染,便于阅读可参考 原博文

摘要

从原始 GPS (全球定位系统) 数据中提取 汽车停靠意图数据 是大多数位置感知应用程序中的关键任务,且随着从移动设备收集 GPS 数据的不断增长,这项任务变得越来越有趣。近期很多研究都集中在行人 (手机) 数据上 (可理解为红海市场),而商用车领域几乎没有探索 (蓝海市场)。

在本论文中,针对车辆 GPS 数据的汽车停靠意图的 识别分类 问题 (利用来自不同行业的商业车队的大型异构数据集)。按照意图分类,旨在把汽车停靠点分为:工作相关非工作相关

对于每个汽车停靠点,要计算一组含 100 个不同特征的集合 (特征可分为四个主要类别:汽车停靠点特征,兴趣点特征,汽车停靠点集群特征和序列特征),并通过随机森林分类模型,评估四组中每个特征对停靠点的相对重要性。

实验结果表明,本论文的方法显着地超越了现有商业车辆背景下用于汽车停靠意图的分类模型。

正文

引入

在过去的十年中,GPS 设备的巨大推广,使得人们越发关注 数据挖掘算法时空数据 (GPS 产生的数据) 中的应用。而许多实际应用需要使用关于用户行为和地理位置的语义信息。例如,下述的两个实例:基于用户的历史位置以衡量用户之间的相似度 $^{[1]}$; 基于位置的兴趣地点推荐系统 $^{[2]}$。

语义标记 GPS 数据,目标旨在 识别归类 GPS 沿途轨迹上的位置信息,即具体工作有 语义位置的侦察汽车停靠或出游的意图识别。既管上述问题不是同一类型的问题,但却是强相关的。例如,对多个用户而言具有相同意图的共同定位点,可能是语义上相关联的地方 (反之亦然),因为知道某个地方的语义对分类每个汽车停靠点意图有很大的帮助。

通常,对于上述问题的解决方法分两个阶段执行:

最后说明,本论文解决了与参考文献 [7] 的同样问题,即利用四个不同的特征集,使用一个随机森林分类器,对商业车队的汽车停靠意图数据进行分类。且本文的主要贡献如下:

方法

GPS和工单数据

车辆停靠侦查技术

正如上述所描述的,关于瞬时车辆位置的原始数据是由 GPS Ping 组成的,将它们汇集起来以描述车辆的活动。为此本论文开发了一个 时空聚类程序

贴标签

分类特征

车辆停靠侦查技术 章节中描述的,从一系列的 GPS Pings 提取汽车停靠点,并从中提取 100 个不同的特征用于训练随机森林模型,随之将这些特征划分为 4 个不同的组:

不足

参考

[1] Horozov T, Narasimhan N, Vasudevan V. Using location for personalized POI recommendations in mobile environments [C]//Applications and the internet, 2006. SAINT 2006. International symposium on. IEEE, 2006: 6 pp.-129.
[2] Jiang K, Yin H, Wang P, et al. Learning from contextual information of geo-tagged web photos to rank personalized tourism attractions [J]. Neurocomputing, 2013, 119: 17-25.
[3] Palma A T, Bogorny V, Kuijpers B, et al. A clustering-based approach for discovering interesting places in trajectories [C]//Proceedings of the 2008 ACM symposium on Applied computing. ACM, 2008: 863-868.
[4] Gong L, Sato H, Yamamoto T, et al. Identification of activity stop locations in GPS trajectories by density-based clustering method combined with support vector machines [J]. Journal of Modern Transportation, 2015, 23(3): 202-213.
[5] Ester M, Kriegel H P, Sander J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise [C]//Kdd. 1996, 96(34): 226-231.
[6] Lv M, Chen L, Xu Z, et al. The discovery of personally semantic places based on trajectory data mining [J]. Neurocomputing, 2016, 173: 1142-1153.
[7] Gingerich K, Maoh H, Anderson W. Classifying the purpose of stopped truck events: An application of entropy to GPS data [J]. Transportation Research Part C: Emerging Technologies, 2016, 64: 17-27.
[8] Sambo F, Salti S, Bravi L, et al. Integration of GPS and satellite images for detection and classification of fleet hotspots [C]//Intelligent Transportation Systems (ITSC), 2017 IEEE 20th International Conference on. IEEE, 2017: 1-6.
[9] Wolf J, Guensler R, Bachman W. Elimination of the travel diary: Experiment to derive trip purpose from global positioning system travel data [J]. Transportation Research Record: Journal of the Transportation Research Board, 2001 (1768): 125-134.
[10] Bohte W, Maat K. Deriving and validating trip purposes and travel modes for multi-day GPS-based travel surveys: A large-scale application in the Netherlands [J]. Transportation Research Part C: Emerging Technologies, 2009, 17(3): 285-297.

上一篇 下一篇

猜你喜欢

热点阅读