深入浅出理解Faster R-CNN

2020-04-03  本文已影响0人  CristianoC

之前讲解了one-stage算法的代表YOLO,今天将以自顶向下的思想,深入浅出地帮助读者理解two-stage算法代表Faster R-CNN。

目录

整体结构

  1. 一些bounding box(把物体框出来的边界框)
  2. 分配给各个bounding box的标签(即每个框里面物体类别标签)
  3. 每个bounding box以及标签的概率


    Faster R-CNN整体架构
  1. 某个框内是否含有物体
  2. 某个框是否框的准,如果框的不准我们要如何调整框
  1. 前面我们只是区分某个框内是否含有物体,这里我们将会具体将物体进行分类(或者将其使用“背景”标签舍弃)
  2. 更好地调整框,让边界框更准

基础网络

Anchor

Region Proposal Network(RPN网络)

RPN获取卷积特征图并在图像上生成可能含有物体的建议
  1. 对于分类层,我们为每个Anchor输出2个预测值:背景得分以及前景得分(实际含有物体)。
  2. 对于边界框回归层,我们输出4个预测值:也就是前面我们提到anchor的偏移值(\Delta x_{center},\Delta y_{center},\Delta width,\Delta height)

RPN网络的训练以及损失函数

RPN后期处理

Region of Interst Pooling(RoI)

Region-based Convolutional Neural Network(R-CNN)

  1. 将建议框的物体进行具体分类(这里要加上一个“背景”类,用于删除错误的建议框)
  2. 根据预测的类别更好地调整我们的边界框
  1. 第一个全连接层有N+1个单元,其中N是物体的类别,加的1是背景类。
  2. 另一个全连接层有4N个单元,对应我们边界框的4个偏移量(x_center,y_center,width,height),其中N是类别数

R-CNN的训练以及目标

R-CNN后续处理

整体训练

参考

上一篇 下一篇

猜你喜欢

热点阅读