大数据,机器学习,人工智能深度学习

目标检测系列 Mask R-CNN—RPN

2020-08-25  本文已影响0人  zidea
mask-rcnn.jpg

RPN
将特征图中像素点作为中心来生成一系列锚框,锚框是不同长宽比率和不同长宽比例组合得到一系列的候选框。这样方式生成候选框替换原来由 selective serch 通过算法来实现候选框生成。这是在 Faster R-CNN 中提出,到现在为止最后一块不是神经网网络涉及的区域也被神经网络占领了。从 R-CNN 到 Faster R-CNN,现在网络结构成为真正的端到端的网络结构。

mask_rcnn_007.jpeg

生成的不同尺度特征图都会通过 3 \times 3 的卷积层后输出到两个分支,一个分支是用于判断是否存在目标(objects) 后面接 softmax 做二分类问题,另一分支用于边界框回归。在这里,仅对一个特征金字塔使用一个锚框尺寸缩放幅度 (因为已经在 FPN 中生成考虑不同大小的目标的不同大小的特征图)和 3 个锚框宽高比。因此目标分支中有 3 个通道,边界框回归中有 3 * 4 个通道。

值得注意的是需要保持训练和测试中所用的锚框的长宽比和尺寸缩放幅度保持一致,因为目标检测评分和边界框回归都是与训练中使用的锚框长宽比和尺寸缩放幅度。

The values of RPN bounding box predictions are independent of dimensions of feature map and will be required to multiplied by image height and width of image during decoding step.

RPN 边界框预测的值与特征图的尺寸无关,并且需要在解码(还原时候)步骤中乘以图像高度和图像宽度。

mask_rcnn_008.jpeg mask_rcnn_rpn_001.jpeg
上一篇 下一篇

猜你喜欢

热点阅读