深度学习

DeepLab系列之V3+

2019-05-26  本文已影响0人  逆风g
  1. DeepLab系列之V1
  2. DeepLab系列之V2
  3. DeepLab系列之V3
  4. DeepLab系列之V3+

概述

在语义分割任务中,spatial pyramid pooling module(SPP)可以捕获更多尺度信息,encoder-decoder结构可以更好恢复物体的边缘信息。

作者主要工作:

  1. 原DeepLabv3当作encoder,添加decoder得到新的模型(DeepLabv3+)。
    如下图所示,作者把spatial pyramid pooling moduleEncoder-Decoder融合成一体:
  2. XceptionDepthwise separable convolution应用到Atrous Spatial Pyramid Poolingdecoder中。

膨胀卷积

v1、v2中已详细说明,略....

深度可分离卷积(Depthwise separable convolution)

depthwise separable convolution=depthwise convolution+pointwise convolution

网络整体结构

  1. Encoder
    Encoder就是原来的DeepLabv3,注意点有2点:
  1. Decoder
    明显看到先把encoder的结果上采样4倍,然后与resnet中下采样前的Conv2特征concat一起,再进行3x3的卷积,最后上采样4倍得到最终结果
    需要注意点:

主干网络

作者在MSRA基础上作了些修改:

实验

  1. decoder结构上的探索
  1. Backbone为Resnet101的结果


  2. Backbone为Xception的结果


  3. 在Cityscapes数据集上


上一篇下一篇

猜你喜欢

热点阅读