M2Det论文

2019-03-01  本文已影响0人  yanghedada

代码地址

M2Det

抽时间看完了达摩院的这篇论文,论文出发点是解决目标检测中的目标尺寸的范围太广,现有的检测模型对小,中,大目标的效果不一样,论文在单步条件下SOTA。

大家无非用的方法有两种:

  1. 图片金子塔
  2. 特征金子塔
    表现的模型如下:

a,b,c是别人的,我们提出了d。
a,b,c这些模型有两个问题:
1.特征表示不足够
2.进行预测的特征只来自一个层

模型

我们为了解决上面这俩个问题, 提出下面的模型:

FFMv1:把所有来自backbone进行融合丰富
TUM:产生一系列多尺度的特征,使用小型的U结构,code和decode layer。
FFMv2:对特征进行抽取
SFAM:对特征进行concation和自适应注意力机制(SEnet)

实验结果:

主要对比vgg16和resnet101,快,准

消融实验

每个策略都很好,特别是decode(SFAM),resnet101也涨的比较高

不能无限加TUM

TUM 和 通道可以相互补充。

上一篇 下一篇

猜你喜欢

热点阅读