CNN

(2014,VGG)Very Deep Convolutiona

2019-01-10  本文已影响0人  运动小爽

1. VGG-Net网络的特点

自从AlexNet在ILSVRC2012上面大放光芒之后,接下参加ImageNet竞赛的所有top模型基本上都采用了CNN网络架构。CNN网络架构在2013年没有很大的进展,其中相对引人注目的一个模型被称为ZF-Net,来自下面这篇论文:

这篇论文的亮点是做了一些CNN网络中各个卷积层feature map的可视化工作,试图解释不同深度/level的卷积层到底学习到了图像内容的哪些特征,探究CNN从低层到高层是如何一步步先提取图像的低级特征,然后对低级特征进行组合,进而得到更加抽象的高级语义特征的。

但从网络结构上来说,ZF-Net没什么亮点,只是对AlexNet进行了小修小补(比如把AlexNet第一个卷积层kernel=11x11/s=4改为kernel=7x7/s=2),最终在ImageNet分类竞赛上面的top-5准确率,也只从AlexNet的16.4%提升到ZF-Net的14.8%。

而在接下来的2014年,CNN网络架构设计迎来了第二次爆发,代表性的两个模型是VGG-Net和GoogleNet。这一节介绍VGG-Net。

VGG-Net这篇论文的主要亮点有:

VGG-Net总共包含了5个版本ABCDE,每个版本的网络结构如下表所示:


VGG-Net网络设计的特点如下:

其中用的最多的是VGG-Net的D版本,习惯上称为VGG16,因为它包含16个权重层。后面我们会知道,VGG-Net的空间复杂度基本上是主流的CNN分类模型中最大的之一。

2. 总结

VGG-Net延续了分类网络中,卷积层+全连接层的设计特点,全程采用了非常小的3x3卷积核,通过实验,不断加深卷积层的数目,得到了一个结构优雅,同时性能强大的经典CNN模型(唯一的缺点是模型复杂度很大),值得一提的是,虽然VGG16在2014年的ImageNet分类竞赛中不敌GoogleNet只得了亚军,但那是多个模型融合后的结果,单个模型的性能的话,VGG16是比GoogleNet强的。这也侧面地证明了VGG卷积架构的优异性。

因此在随后几年,其他领域比如目标检测、场景文本检测以及风格迁移,很多经典模型都使用了VGG16的卷积部分作为特征提取主干网络。

上一篇 下一篇

猜你喜欢

热点阅读