卷积神经网络之-VGGNet

2019-12-25  本文已影响0人  机器视觉CV_有三言选

更多内容请关注『机器视觉CV』公众号,获取免费 GPU算力

VGGNet 是由牛津大学视觉几何小组(Visual Geometry Group, VGG)提出的一种深层卷积网络结构,他们以7.32%的错误率赢得了2014年ILSVRC分类任务的亚军(冠军由GoogLeNet以6.65%的错误率夺得)和25.32%的错误率夺得定位任务(Localization)的第一名(GoogLeNet错误率为26.44%)

论文地址:https://arxiv.org/abs/1409.1556

网络结构

在《Very Deep Convolutional Networks for Large-Scale Image Recognition》论文中,作者给出了 6 个 VGG 模型,对应不同的网络结构和深度,具体结构如下:

不同的网络结构不同的网络结构 不同网络结构的参数量(单位:百万)不同网络结构的参数量(单位:百万)

[图片上传失败...(image-d6a47-1577281530056)]

设计要点

[图片上传失败...(image-2a461b-1577281530056)]

结果分析

imageimage
  1. 网络的性能随着网络的加深而提高。
  2. 应该注意到 B,C,D 这个网络的性能。C 网络好于 B 网络,说明额外添加的非线性激活函数,确实是有好处的;但是,D 网络好于 C 网络,这说明也可以使用非平凡的感受野( non-trivial receptive fields)来捕获更多的信息更有用。
  3. 当网络层数达到 19 层时,使用 VGG 架构的错误率就不再随着层数加深而提高了。更深的网络应该需要更多的数据集。
  4. 论文还将网络 B 与具有 5×5 卷积层的浅层网络进行了比较,浅层网络可以通过用单个 5×5 卷积层替换 B 中每对 3×3 卷积层得到。测量的浅层网络 top-1 错误率比网络 B 的 top-1 错误率(在中心裁剪图像上)高 7%,这证实了具有小滤波器的深层网络优于具有较大滤波器的浅层网络。
imageimage

在单尺度上评估 ConvNet 模型后,我们现在评估测试时尺度抖动的影响。它包括在一张测试图像的几个归一化版本上运行模型(对应于不同的 Q 值),然后对所得到的类别后进行平均。考虑到训练和测试尺度之间的巨大差异会导致性能下降,用固定 S 训练的模型在三个测试图像尺度上进行了评估,接近于训练的尺度:Q = {S−32, S, S+32}。同时,训练时的尺度抖动允许网络在测试时应用于更广的尺度范围,所以用变量 S ∈ [Smin; Smax] 训练的模型在更大的尺寸范围 Q = {Smin, 0.5(Smin + Smax), Smax} 上进行评估。

Dense(密集评估),即指全连接层替换为卷积层(第一 FC 层转换到 7×7 卷积层,最后两个 FC 层转换到 1×1 卷积层),最后得出一个预测的 score map,再对结果求平均。

multi-crop,即对图像进行多样本的随机裁剪,将得到多张裁剪得到的图像输入到网络中,最终对所有结果平均

imageimage

模型特性

参考:

上一篇 下一篇

猜你喜欢

热点阅读