Machine Learning && Computational Catalysis深度学习深度学习-推荐系统-CV-NLP

SSD论文阅读笔记

2017-11-29  本文已影响209人  Mordekaiser

论文:SSD: Single Shot MultiBox Detector
Github : SSD

SSD类似YOLO,和YOLO同属于目标检测算法中基于回归的算法。

Abstract

作者提出了SSD模型,把输出的bounding boxes看成一组不同尺度,不同大小的boxes。说白了,就是在不同尺度上的feature map上设置一系列不同大小的default boxes。实现了多尺度的检测,这个思路有点类似于faster rcnn里面的anchor boxes。不过anchor boxes实现多尺度的方法不是在不同的feature map上做回归,而是直接设置不同比例的boxes。SSD模型相比于rcnn系列模型,取消了region proposal的过程,即没有像素,特征重采样(对应于faster rcnn 的ROI Pooling)的过程,提升了运行速度,并且得益于多尺度的检测,精度上并没有损失,甚至在512x512大小的图片上超过了faster rcnn。

Introduction

基于深度学习的目标检测网络主要有两大类,一类是以RCNN为代表的region proposals方法,该类方法速度较慢,最快的faster rcnn在GPU上也只有7FPS,另一类是以YOLO为代表的基于回归的算法。YOLO虽然在速度上很快(45 FPS),但是精度很低。作者本文就是解决了速度与精度的矛盾问题,提升了模型的速度,同时避免了精度的损失,SSD和YOLO同属一类基于回归的算法。

SSD

SSD和YOLO结构对比

1.预测过程

2.训练过程

实验结果

取得了速度上的提升,精度也还不错。作者做的工作其实就是速度和精度的一个trade-off。主要创新之处在于:

上一篇下一篇

猜你喜欢

热点阅读