3.2 ThunderNet思考

2019-05-02  本文已影响0人  深度学习模型优化

1 设计思想

ThunderNet的优化目标是二阶段检测器中计算开销大的结构。

2 网络架构

图1 ThunderNet网络架构

ThunderNet的输入是320 \times 320分辨率的图像。

3 实现

backbone部分:

  1. 输入图像的分辨率应该和骨干网络的能力相匹配。
  2. 骨干网络需要利用深层语义信息和浅层高分辨信息。

考虑到ShuffleNet V1/V2限制了感受野,ShuffleNet V2和MobileNet V2缺乏浅层特征,Xception在算力低的情况下缺乏深层特征。作者对ShuffleNet V2进行了改进,这里的backbone网络称为SNet(为了检测目的单独设计)。

图2 SNet的网络结构

SNet49用于更快的推理,SNet535用于更好的精度,SNet146用于更好的速度/精度权衡。

detection部分:
为了与backbone网络匹配,作者改进了light-head R-CNN的head部分,主要设计了两个模块。

  1. Context Enhancement Module(CEM)。
图3 Context Enhancement Module

CEM合并三个尺度的特征图。

  1. Spatial Attension Module(SAM)
    思想:使用来自RPN学习到的知识来细化特征图的特征分布。

F^{SAM} = F^{CEM} \cdot sigmoid(\theta(F^{FPN}))

其中\theta(\cdot)是一个尺度变换,用来匹配两组特征图中的通道数。

图4 SAM结构

4 性能分析

图5 VOC2007上的性能 图6 COCO数据集上的性能

5 总结

本文首先介绍了ThunderNet的思想,然后简介了ThunderNet的网络结构,以及重点改进的CEM和SAM结构,最后给出了在VOC2007和COCO数据集上的性能比较。

上一篇 下一篇

猜你喜欢

热点阅读