神经网络

deeplab系列总结

2019-03-21  本文已影响0人  LuDon

前言

在传统的语义分割问题上,存在的三个挑战:

Deeplab系列针对的是语义分割任务。对于语义分割任务要求:

Deeplab v1 & v2

论文Deeplab v1
由于语义分割是像素级别的分类,高度抽象的空间特征对low-level并不适用,因此必须要考虑feature map 的尺寸和空间不变性。
feature map变小是因为stride的存在,stride>1是为了增加感受野的,如果stride=1,要保证相同的感受野,则必须是卷积核大小变大,因此,论文使用hole算法来增加核大小进而达到相同的感受野,也就是空洞卷积。
图像输入CNN后是一个倍逐步抽象的过程,原来的位置信息会随着深度而减少甚至消失。条件随机场在传统图像处理上做一个平滑,也就是说在决定一个位置的像素值时,能够考虑周围邻居的像素值,抹茶一些噪音。

具体的操作为:移除原网络最后两个池化层,使用rate=2的空洞卷积采样。标准的卷积只能获取原图1/4的内容,而新的带孔的卷积能够在全图上获取信息。

Astrous conv

对使用了s=2后的lower resolution feature map再进行标准的卷积的效果和在原来的feature map上使用rate=2的空洞卷积的效果是一样的。


空洞卷积

ASPP结构

使用多尺度进行空洞卷积,在经过1*1的卷积之后连接起来。多尺度特征提取,得到全局和局部特征


ASPP结构 DeeplabV1

DeeplabV1是在VGG16的基础上做了修改:

DeeplabV2
Deeplab v2
Deeplabv2是在v1上进行改进的:

Deeplab V1和V2的优点:

Deeplab v3

v3的主要创新点就是改进了ASPP模块,一个11的卷积和3个33的空洞卷积,每个卷积核有256个且都有BN层,包含图像及特征(全局平均池化)。

Deeplab v3+

空间金字塔池化模块(SPP)和编码解码结构,用于语义分割的深度网络结构。SPP利用多种比例和多种有效感受野的不同分辨率特征处理,来挖掘多尺度的上下文内容信息,编解码结构逐步重构空间信息来更好的捕捉物体边界。

参考文献

[1]deeplab 官方PPT
[2]Deeplab v1---v3+

上一篇 下一篇

猜你喜欢

热点阅读