华为-2020-CVPR-最新轻量级网络-GhostNet分析

2020-06-16 本文已影响0人教训小磊

论文题名：《GhostNet: More Features from Cheap Operations》

arxiv: https://arxiv.org/abs/1911.11907

github :https://github.com/huawei-noah/ghostnet

GhostNet是华为诺亚方舟实验室最新的轻量级深度学习网络，作者从卷积神经网络特征图冗余这一特点出发，设计了类似于深度可分离卷积这种分阶段进行操作的计算模块，简单来说就是在非线性卷积的基础上再进行一次线性卷积，以达到在较低计算量的情况下获得更多特征图的目的。

1.设计思想来源

本文作者在观察ResNet50第一个残差块输出的特征图时，发现有许多输出特征很相似，图一中的红、绿、蓝框的特征图，作者认为很相似，基本只要进行简单的线性变换就能得到，而不需要进行复杂的非线性变换得到（注意：文中说的卷积操作是卷积-批归一化-非线性激活全套组合，而所谓的线性变换或者廉价操作均指普通卷积，不含批归一化和非线性激活。）

图一 ResNet50 部分特征图

2.模块设计

依据上述现象，作者提出了一种叫做Ghost module的轻量级计算模块，具体思路是：先进行一次普通的卷积（即卷积-批归一化-非线性激活），只不过它的输出特征图数量要少很多，目的就是减少计算量，然后在这个基础上通过线性变换（即卷积），这个线性变换更加具体一点是深度卷积，输出包含一个恒等映射图和s-1个其他特征图（s为第一次卷积后的每个特征图变换的次数），文中恒等映射前后叫做Intrinsic feature maps，经过线性变换后（除恒等映射的特征图）叫做Ghost feature maps，具体过程如下图2所示：

图二 Ghost module

该模块涉及到2个非常重要的参数，s和d 分别是线性变换的次数以及线性变换过程中卷积核的大小，本文给出的结果是这两者分别取2和3最合适，不过我觉得，在实际开发过程中还需要手工测试。

3.计算量和参数量对比

Ghost 模块为什么可以称为轻量化模块，当然是在计算量和参数量这边有下降喽！

3.1 计算量对比

假设输入数据的张量是c $\cdot$ h $\cdot$ w，分别为输入通道、特征图高和宽，经过一次卷积后输出数据的张量为n $\cdot$ h' $\cdot$ w'，分别为输出通道、输出特征高和宽，卷积核大小为k，线性变换卷积核大小为d，经过s次变换，那么普通的卷积操作（bn和relu不纳入计算量对比这里）的计算量与Ghost 模块的计算量对比为：