PCN

2019-01-29  本文已影响12人  LuDon

1、引言

一般情况下有三种策略来解决旋转变换:

为了解决以上难题本文提出了一个实时准确的旋转不变性人脸检测方法,改进的校正网络。如下图所示。


PCN

该网络分成三个部分:

本文的创新点在于:

PCN

PCN-1

对于每个输入窗口x,PCN-1有三个目标:有脸和没脸的分类,边界框的回归,和校正:
[f, t, g] = F_1(x)
f是人脸的置信分数,t是表达边界框的向量,g是方向分数。

第一个目标函数检测是否有脸,是最基本的目标:
L_{cls} = ylogf + (1-y)log(1-f)
其中如果x是脸y=1, 否则y=0

第二个目标函数回归人脸边界框:
L_{reg}(t,t^*) = S(t-t^*)
其中tt^*分别是预测的和实际的边界框,Sl_1损失,边界框回归目标包括三个目标项:
t_w = w^*/w
t_a = (a^*+0.5a^*-a-0.5w)/w^*
t_b = (b^*+0.5b^*-b-0.5w)/w^*
其中a,b,w分别表示框的左上方坐标和框的宽度。

第三个目标函数预测人脸的校正方向:
L_{cal} = ylogg + (1-y)log(1-g)

综上,PCN-1的目标函数为:
minL = L_{cls} + \lambda_{reg}L_{reg} + \lambda_{cal}L_{cal}

第一阶段预测的角度为:
\theta_1 = \begin{cases} 0°,\quad g>=0.5 \\\\ 180°,\quad g<0.5 \end{cases}

PCN-2

PCN-2在第二阶段预测旋转角度:
id = arg \quad max g_i

\theta_2 = \begin{cases} -90°,\quad id = 0 \\\\ 0°,\quad id = 1 \\\\ 90°,\quad id = 2 \end{cases}
[-90°,-45°], [-45°,45°], [45°,90°]分别标记为0,1,2

PCN-3

第二阶段之后,所有的人脸校正为[-45°,45°]范围内。因此,第三阶段会更容易更准确的校正人脸。

经过三个阶段之后,人脸的旋转角度为三个阶段旋转的角度之和:
\theta_{RIP} = \theta_1 + \theta_2 + \theta_3
如下图所示,

RIP旋转角度

PCN结构如下图所示


PCN结构

参考文献

[1] Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks
[2] github

上一篇下一篇

猜你喜欢

热点阅读