SPP-Net

2018-09-26  本文已影响0人  两全丶

SPPNet

Abstract

Key insight

Break point

1. Introduction

传统CNN的问题

传统的CNN要求输入图像尺寸是固定的

原因

SPP

优点

SPP对R-CNN的改进

R-CNN的问题

改进

2. Deep Networks With Spatial Pyramid Pooling

2.1 Convolutional Layers and Feature Maps

该节主要可视化了卷积神经网络的feature map,并分析了一些filter的识别的模式(在CS231n中有提到过这种方法)

feature map的可视化

直接画图就可以了

filter识别模式的分析

  1. 挑出某一个卷积层中的某一个filter
  2. 在数据集中,寻找在该filter上有最大activation的图片(应该是通过feature map的L2 norm来判断的?不太清楚)
  3. 在原图中标注出activation最强的部分

可以发现特定的filter在寻找一些特定模式

2.2 The Spatial Pyramid Pooling Layer

2.3 Training the Network

Single-size training

SPP的实现

Multi-size training

  1. 设定一些预先选定的尺寸
    • 在文中选用180 \times 180224 \times 224
    • 如何得到180 \times 180的图片?
      • 224 \times 224的图片resize到180 \times 180, 使得两图只是scale不一样,但是内容布局一样
  2. 训练两个网络,每训练一个epoch,交换两个网路的输入图片尺寸(应该用一个网络就够了吧?)

注意在测试时不需要用multi-size

目的

3. SPP-Net For Image Classification

3.1 Experiments on ImageNet2012 Classification

数据增强

和AlexNet是一样的

正则化

学习率

3.1.1 Baseline Network Architectures

3.1.2 Multi-level Pooling Improves Accuracy

3.1.3 Multi-size Training Improves Accuracy

3.1.4 Full-image Representations Improve Accuracy

3.1.5 Multi-view Testing Improve Accuracy

固定尺度输入多个View

多个尺度输入多个View

3.1.6 Summary and Results for ILSVRC 2014

3.2 Experiments on VOC 2007 Classification

3.3 Experiments on Caltech101

4 SPP-Net For Object Detection

Key Point

Fine-tuning

Proposal

预处理

特征提取

训练SVM

NMS

Bbox Regression

Mapping a Window to Feature Maps

Feature map之间坐标映射关系

我们需要知道网络里面任意两个feature map之间的坐标映射关系(一般是中心点之间的映射),如下图,我们想得到map 3上的点p3映射回map 2所在的位置p2(橙色框的中心点)

SPP-Net映射方法

SPP-net 是把原始ROI的左上角和右下角 映射到 feature map上的两个对应点。 有了feature map上的两队角点就确定了 对应的 feature map 区域(下图中橙色)。

的作用效果分别是增加和减少。也就是 左上角要向右下偏移,右下角要想要向左上偏移。个人理解采取这样的策略是因为论文中的映射方法(左上右下映射)会导致feature map上的区域反映射回原始ROI时有多余的区域(下图左边红色框是比蓝色区域大的)

上一篇下一篇

猜你喜欢

热点阅读