YOLOv1——YOLOv5

2020-11-17 本文已影响0人斯文攸归

YOLOv1

YOLOv1提出单阶段anchor-free的目标检测方法
将图像分为SxS的grid cell，每个有物体中心落入的grid cell对应回归B个BBox，每个grid cell预测一个P(Cls|Object)，B个BBox，每个BBox预测5个值：x，w，h，w，confidence，损失函数包括三部分，坐标回归误差，分类误差和IOU误差

YOLOv2

YOLOv2 在v1基础上提出多项改进

yolov2

BatchNorm加入到每个卷积层的后面，效果提升2.4%
用高分辨率（448x448）的图像来微调分类模型（backbone），效果提升4%
使用anchor boxes（相对于cell进行偏移，框的重心不能超过cell），每个grid cell产生9个anchor boxes（13x13x9），移除全连接层（Darknet-19，19个卷积+5MaxPooling），输入图像尺寸可以是任意的
对anchor box的设置进行k-means聚类，k=5
passthrough，将最后的pooling+convolution之前的特征（26x26x512）在空间维度上拆分为四份（13x13），然后拼接，并叠加到Pooling+Convolution的结果上，以此来保留部分细节信息，缓解小目标的漏检问题
多尺度图像训练，整个网络降采样的倍数是32，采用10种图像尺寸，训练时10个batch就随机更换一种尺寸
增加输入图像的分辨率，效果提升