3 计算机视觉-阅读笔记(4)

2019-04-25  本文已影响0人  深度学习模型优化

3.3实例分割

3.3.1 问题描述

实例分割:

3.3.2 Mask R-CNN

图1 Mask R-CNN是Faster R-CNN的基础上增加一个Mask分支

Mask R-CNN是在Faster R-CNN的基础上改进得到的。其算法步骤为:

图2 Mask R-CNN结构图

这里的RoIAlign(划重点)比较重要,下面重点介绍下。

3.3.3 ROI Align

RoI Pooling存在的问题(不匹配问题):

上面的两个量化,会产生一定的偏差,导致检测和分割的准确度。

图3 RoI Pooling存在两次量化误差

如上图中的红色框所示。
一只狗狗的bbox为665 \times 665

于是误差出来了。为解决该问题,引入了成为RoI Align的方法。


图4 RoI Align能避免量化误差

RoI Align的思想:

举例来说:

图5 RoI Align能避免量化误差 图6 RoI Align的插值

RoI Align的步骤为:

3.3.4 损失函数

Mask R-CNN不仅损失函数包括:

L = L_{cls} + L_{bbox} + L_{mask}

上一篇 下一篇

猜你喜欢

热点阅读