mmdetection官方文档阅读
2019-09-25 本文已影响0人
wctgogo
mmdetection
Pytorch实现的目标检测&实例分割及相关组件的工具箱
特点
- 模块化,用户可以通过组合不同的模块自定义网络
- 封装支持大量现有网络
- 高效&SOTA
主要内容
- 现有网络的高质量复现
- mmdetection结构
- Benchmarks
- Ablation studies
现有网络的高质量复现
-
复现框架,包括如下
single-stage(RetinaNet)
two-stage(Faster R-CNN, Mask R-CNN)
multi-stage(Cascade R-CNN),
anchor-free(FCOS)等
支持列表.png - 实现常用组件,包括如下
soft nms, OHEM, DCN(可变卷积,RepPoints),GN等
mmdetection结构
-
结构模块化
模块化.png -
增加hooking mechanism,提升flexibility
hooking.png
Benchmarks
实验设置
- data
支持数据格式:voc-style, coco-style
默认数据:MS COCO2017 - setup
resize:1333*1000
epochs:12/24/20 - evaluation
RPN:average recall(AR)
detection:mAP
实验结果
-
不同backbone,不同网络的mAP-fps结果
mAP-fps.png -
comparison
其他的工具箱:
Detectron(caffe2)
maskrcnn-benchmark(pytorch)
simpleDet(mxnet)
比较指标:
speed:train--->iter/s,test--->fps
memory:GB
performance:AP
comparison.png
Ablation studis
对比试验,探究不同的结构,训练策略,超参数对性能的提升
- regression loss
不同的regression loss
回归损失的权重 - BN
不同的eval&requires_grad搭配
BN种类:BN,GN,SBN - 尺度问题
输入img不改变长宽比的条件下进行随机缩放,以下两种策略
1333x[640:800:32],即range为32
1333x[640:800],即range为1 - smoothl1的参数beta
- 超出img的anchor是否剔除
- anchor中正负样本比例上限