FPN 算法
2021-04-14 本文已影响0人
LCG22
参考链接:
【目标检测】FPN(Feature Pyramid Network)
1、什么是 FPN
FPN(Feature pyramid network) 是特征金字塔,是用来解决物体检测中的多尺度问题,它通过改变网络连接方式,在基本不增加计算量的情况下,大幅度提高了物体的检测性能。
FPN 通过自底向上的方式对特征图提取越来越抽象的特征,但是这种方式对小物体检测不友好,因此 FPN 增加了自上而下的方式,来对高阶的特征使用线性插值法来进行上采样,再跟下一阶的特征进行横向连接,使得每一层的特征图都融合了不同分辨率,不同层级语义的特征,可以完成对应分辨率的物体进行检测,保证每一层都有合适的分辨率以及高层语义特征
值得注意的是:横向连接的两层特征在空间尺寸上要相同,这样做可以利用底层定位细节信息
2、FPN 的网络结构

3、FPN 的算法步骤
4、FPN 的优点
① 可以同时利用低层特征的高分辨率和高层特征的高语义信息
5、FPN 的缺点
6、横向连接(Lateral connection)的步骤
① 对第 n 层的特征使用 1*1 卷积来修改通道数
② 对第 n+1 层的特征使用线性插值法来进行上采样,然后跟步骤 ① 的结果进行按元素相加
③ 对步骤 ② 的结果使用 3*3 卷积,目的是为了消除上采样产生的混叠效应(aliasing effect)
注:
混叠效应:上采样与原图叠加,造成特征的不连续,在原特征图上的失真(特征混乱);
解决方法:再做卷积相当于 filter 操作,使之“还原”,也就是特征的再提取,保证特征的稳定性;