YOLOv1算法解析

2021-07-07  本文已影响0人  Epimenides
YOLOv1算法处理思路
  1. 将一幅图像分成SxS个网格(grid cell), 如果某个object的中心落在这个网格中,则这个网格就负责预测这个object。
YOLO算法的流程
  1. 每个网格要预测B个bounding box,每个bounding box 除了要预测位置之外,还要附带预测一个confidence值。每个网格还要预测C个类别的分数。

    在YOLOv1论文中

    • 并将训练集图片分割成7x7个网格.(S = 7

    • 每个网格预测两个bounding box.(B=2

    • 使用的PASCAL VOC数据集的类别数为20.(C=20

经过正向传播网络得到的7x7x30特征矩阵

每一个bounding box包含五个预测参数(x,y,w,h)&confidence

bounding box的confidence计算公式 YOLOv1网络结构
  1. YOLOv1的损失函数:
bounding box损失函数 confidence 损失函数 预测类别的损失函数
  1. YOLOv1存在的一些问题

    • 对于检测一些群体性小目标的检测效果较差

    • 目标出现了新的尺寸和配置,预测效果较差

    • 定位不准确,后面的改进(YOLOv2及以后)采用基于anchor的回归。

上一篇下一篇

猜你喜欢

热点阅读