图像检测(下)
区域卷积神经网络(R-CNN)系列
R-FCN
模型进化:共享卷积层计算
R-CNN->SPP-Net->Fast R-CNN->Faster R-CNN
模型进化R-CNN系列的结构:
基于旧形态CNN的结构(AlexNet,VGG)
全卷积子网络,全连接子网络
相对应的设计结构
全卷积子网络(5层/组)独立于RoI,计算共享。
RoI-wise子网络(3层)计算无法共享
R-FCN
CNN的全卷积化趋势(ResNet,GoogLeNet)
只剩一个全连接层(2048-1000)
相应的,基于旧结构设计的R-CNN会出现问题
结构:RoI-wise子网络无隐含层
性能:检测性能跟分类性能不一致
应用两难:检测网络的变换敏感性,分类网络的变换不变性,卷积层越深,不变性越强,对变换越不敏感。
不适应设计:ResNet-101->conv91+RoI池化+conv10
准确性提升,但是速度下降。
适应全卷积化CNN的结构,提出全卷积化设计
共享ResNet的所有卷积层
引入变换敏感性
位置敏感分值图:特殊设计的卷积层,Grid位置信息+类别分值
位置敏感池化:无训练参数,无全连接网络的类别判断
R-FCN卷积R-FCN的位置敏感卷积层
使用个通道对(位置,类别)组合进行编码。
类别:C个物体类+1个背景类,相对位置:K*K个Grid(K=3),位置敏感分值图:每个类别个score map,score map尺寸=图片尺寸
R-FCN的位置敏感RoI池化层
显示地编码相对位置信息
将W*H尺寸的RoI拆分成K*K个尺寸的bin,不同(颜色)bin对应不同(颜色)通道层(score map),Bin内做均值池化,输出尺寸K*K*(C+1)
R-FCN的位置敏感RoI池化层多分类损失函数
多分类损失函数