CFENet: An Accurate and Efficien
北大+阿里巴巴——自动驾驶场景下的小目标识别(ACCV2018)
Abstract
在自动驾驶场景中,对于小目标的检测精度和速度非常重要,在SSD的基础上,提出一个轻量级的框架,引入一个Comprehensive Feature Enhancement(特征增强模块,CFE),检测速度与RefineDet相当,但是精度较好,尤其是小目标检测更准确。
介绍
SSD对于小目标的检测效果并不好,在COCO数据集上small object的AP只有10.9,召回率只有16.5。它使用浅层特征来检测目标,浅层特征不具备丰富的语义信息,因此对分类来说区分度不高,容易造成分类错误。RefineDet使用了Encode-Decode 的结构来加深网络 ,并且用上采样来使大尺度特征图获取更多的语义信息,同时用级联回归的方式,Encode模块获取粗糙的位置,Decode模块进行位置精修。最终,在COCO数据集上small object的AP为16.3,召回率为29.3。
SSD采用特征金字塔的结构,Conv4_3等低层特征用于检测小目标,高层特征用于检测较大的目标。根据训练数据集上的对象尺度分布确定对应于每个特征图的锚点框尺寸的范围,在锚点匹配古城中,首先为每个标注框匹配一个拥有最高重叠比的默认框,然后将与任何标注框的重叠比大于0.5的默认框匹配到对应的标注框。尽管SSD缓解了物体初度变化引起的问题,但是在小目标检测问题上还是局限性,主要原因是采用Conv4_3来检测小目标,该层特征太浅,没有足够的高层语义信息。本文旨在加强SSD的特征以此提高小目标检测性能。
CFENet
CFENet 包含四个特征增强模块(CFE)和两个特征融合模块(FFB)。
CFENet网络结构CFE模块结构如下图,包含两个类似的分支,将的卷积分成和的卷积,减少参数量的同时加深感受野,然后再接一个的卷积,两个分支的不同之处在于卷积的分解顺序,这个模块用于加强SSD结构中用于检测小目标的浅层特征(Conv4_3,Fc_7)。参考Xception模块,Large separable模块,ResNeXt模块。同时引入FFB模块将较浅层的特征融合,并接CFE模块产生用于检测的特征。
CFE模块Experiments
对于小目标提升效果比较明显。
COCO数据集上的实验对比 Berkeley DeepDrive数据集上的实验