From 铝型材表面瑕疵识别比赛总决赛答辩视频:

2020-02-16  本文已影响0人  oneoverzero

视频链接:https://tianchi.aliyun.com/course/video?spm=5176.12586971.1001.25.41ac2881DxCw7l&liveId=36945

shuzhilian ai:

总共有十种瑕疵类别,首先要分析每一种瑕疵类别的样本数目各是多少,由此得出样本分布是不均衡的:

20200215-1.PNG

所以首先要用图像处理的方法做数据增强,把每一类样本增加到 5000 份左右。

接着还要统计缺陷的尺寸分布情况:

20200215-2.PNG

尺寸变化非常大。针对这一问题采用的结构是 Faster RCNN + FPN + Cascade RCNN。

因此整体的方法是:

20200215-3.PNG

先做数据增强,然后再采用上述的架构,backbone: ResneXt152。

针对不同尺寸的缺陷所做的改进:

20200215-4.PNG

Cascade RCNN 结构:

20200215-5.PNG

小结:

20200215-6.PNG

评委提问:

风不动:

将各种缺陷的图像展示了出来:

20200215-7.PNG

并分析了所给数据的特点:

20200215-8.PNG

FPN 结构可以适应更多的大小尺度。

针对不规则和微小目标的检测方案:(Detection for Irregular and Tiny Objects, DIT)

DCN: Deformable Convolutional Networks

什么是 ROIPooling?什么是 ROIAlign?为什么后者比前者的效果好?

什么是 anchor?

什么是 hard example mining?什么是 OHEM?什么是 batch 级别的 OHEM?

测试阶段:什么是 NMS?什么是 Soft-NMS?什么是投票平均?

20200215-9.PNG

总结:

20200215-10.PNG

评委提问:

树根互联 AILab:

整体框架:Faster R-CNN + FPN(解决瑕疵尺度多样化问题)

backbone: ResNet101

GDUT-WWW:

什么是 aspect ratio?

评委提问:

打怪升级:

《基于多尺度 Mask-RCNN 的瑕疵检测》

20200215-11.PNG

多尺度有助于检测小瑕疵。也就是将一张图片分别 resize 到不同尺寸。

soft-NMS 可以解决重叠框误删的问题。

box voting。

20200215-12.PNG

Are you OK?

每个类别 bbox 数量的统计,及 bbox 大小的数量的统计:

20200215-13.PNG

FPN: Feature Pyramid Networks

SWA (Stochastic Weight Averaging )

上一篇 下一篇

猜你喜欢

热点阅读