十八
2021-08-27 本文已影响0人
TiTiWung
基于深度学习的警情地址智能分析模型。。。。。
苏州交警当前日均警情量约2000起,平台接处警人员需为每个警情进行人工标注,耗时长、准确率低。通过本模型的建设,可以实现警情地址自动化、精准化标注。模型通过自我学习能力不断提高警情定位精度,有效提升了警情快速响应能力和后续研判分析能力。。。
模型数据来源于2021年1月至7月警情数据,共40余万条,以及互联网公司提供的道路基础数据,共500余万条。。。。。。
本模型建模流程分为四步,下面具体介绍每一步的实现:。。。。。
第一步:利用BERT算法提取警情地址关键信息。。。。。
本模型建设了一套路内及路外的结构化地址标签体系,将1月份的6万余条警情训练数据进行人工标注,并利用样本均衡法,扩充至10万条。最后,通过6层编码器和解码器的BERT算法,提取警情地址并形成对应标签。。。。。。
第二步:关联警情地址。。。。。
根据上一步提取的警情地址标签,关联搜索道路基础数据库,从500余万条底库中筛选出数千条警情关联地址。。。。。。
第三步:利用多层感知机计算关联地址匹配度得分。。。。。
本模型搭建了5层感知机,将警情地址与关联地址输入感知机进行训练,得到关联地址匹配度得分。。。。。。
第四步:经纬度计算。。。。。
选取匹配度得分最高关联地址的经纬度,并用相对位置法进行经纬度纠偏,得到警情真实地址。
。。。。。
2月至7月,支队通过全域一体化平台搭载本模型进行警情的自动化、精准化标注,改变了传统的人工标注模式。通过自我学习,模型的准确率和召回率由82.54%、 81.77%提升至90.4%、 89.47%。大队7月份节省警情标注时间合计27.94人天,极大提升了工作效率。