2019-09-28 MTCNN解读1
2019-09-28 本文已影响0人
sharer7717
image.png
image.png
image.png
image1.png
image2.png
image3.png
image4.png
image5.png
其中face classification为人脸图像的概率:长度为2的一维向量,bbox是回归框的信息:长度为4的一维向量,facial landmark是关键点的位置:长度为10的一维向量。
pnet网络没有对卷积层的输出作平滑处理,1132不是通常的平滑层,主要是因为实际应用时输入图像尺寸不一,若使用flat层,即平滑层每次输出的特征的尺寸也是大小不一的,利用卷积层时,可以让输入大小不一的图像输出维度不一的特征向量。 image.png image.png image3.png image.png image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
其中face classification为人脸图像的概率:长度为2的一维向量,bbox是回归框的信息:长度为4的一维向量,facial landmark是关键点的位置:长度为10的一维向量。
pnet网络没有对卷积层的输出作平滑处理,1132不是通常的平滑层,主要是因为实际应用时输入图像尺寸不一,若使用flat层,即平滑层每次输出的特征的尺寸也是大小不一的,利用卷积层时,可以让输入大小不一的图像输出维度不一的特征向量。 image.png image.png image3.png image.png image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png