2018-08-21

2018-11-26 本文已影响0人 Alpha_4509

Spatial Transformer Networks

尽管CNN网络定义了许多强而有力的模型，但是它仍被限制于缺乏对输入数据空间上不变性的有效计算。本文介绍了一个新的可学习模块，空间转换器，该模块显著地增加了网络中数据的可操作性。该模块可以植入到现有的卷积体系中，使神经网络具备了空间上转换特征映射的能力。

虽然采用池化操作使得CNN对特征的形变和尺度变化具有一定的鲁棒性，但也使得其受限于深层次的网络，并对中间层的特征并非不变的。CNN的这种限制是由于只有一个有限的，预定义的池化机制来处理数据空间排列的变化。

本文介绍了一种基于神经网络架构的三维空间变换模块，于接受域是固定且局部的池化层不同，空间转换器模块是一种动态的机制，它可以通过为每个输入样本生成适当的转换来主动地进行空间转换，然后在整个feature map上执行转换，包括缩放、裁剪、旋转以及刚性变形等。这使得包含空间转换器的网络不仅可以选择最相关的区域，而且还可以将其转化为规范、预期的姿态，从而简化后续层的识别。

利用空间转化网络作为全连通网络的第一层，对畸变的MINIST数字进行分类的效果如下：