目标检测网络之Faster-rcnn解读(一)

2018-10-10  本文已影响0人  wenyilab

[Paper:Faster R-CNN: Towards Real-Time ObjectDetection with Region Proposal Networks]
[https://arxiv.org/abs/1506.01497v3]
该论文主要做出了两点贡献:
1、提出区域建议网络RPN,快速生成候选区域;
2、通过交替训练,使RPN和Fast-RCNN网络共享参数

Faster-rcnn的重要性

RCNNs刚出来时是十分费时的,经过一系列的改进,如推荐区域共享卷积,已经使得处理速度大大加快了,而Fast-rcnn如果不考虑区域推荐的耗时,只使用深度网络是已经达到几乎实时的处理速度,但区域推荐是检测系统的瓶颈,当时最受欢迎的是选择性搜索-首先通过基于图的图像分割方法初始化原始区域,即将图像分割成很多很多的小块,然后使用贪心策略,计算每两个相邻区域的相似度,每次合并最相似的两块,直到最终只剩下一块完整的图片,每次产生的图像块包括合并的图像块都保存下来。和检测网络相比,选择性搜索慢了一个数量级。也就是说,在整个目标检测网络中,区域推荐部分是主要的耗时阶段。为了解决这个问题,作者引出了非常有效的方式,使用深度卷积神经网络来计算推荐区域,在给定的检测网络完成的计算基础上,让区域推荐的计算几乎为0,这就是RPN,它和fast-rcnn共享卷积层,大大加快了检测网络速度。

介绍神奇的区域建议网络(RPN)

RPN是一种完全卷积网络(FCN),可以为特定的任务进行端到端的训练来产生推荐。下图是参考ZF网络结构的RPN:


wenyilab

RPN网络的输入是一张图像,输出分为两支,一支是目标和非目标的概率,另一支是bbox的四个参数,分别是bbox的中心坐标x,y以及bbox的宽w和长h。
为了得到输出的区域建议,是用了一个小网络在ZF网络(5个卷积层)最后一个卷积层特征图上滑动,每个滑动窗口都映射到一个维度更低的特征,最后是形成两个并列的全连接层,一个box回归层(reg)和box分类层(cls)

上一篇下一篇

猜你喜欢

热点阅读