[2018CVPR]Finding Tiny in the Wi

2019-02-24  本文已影响0人  Aptitude

消失这么久,终于决定要出现了……

Abstract

利用生成对抗网络(generative adversarial network, GAN)将一个模糊的小人脸图片生成一个清晰的高分辨率图片。主要工作如下:

1. Introduction

Paragraph1:简单介绍了人脸检测,说明人脸检测在一些方面的挑战。
Paragraph2:介绍了在小图片上的人脸检测,现有的研究中的一些问题。采用降采样的卷积神经网络忽视空间细节,太过粗糙难以描述小脸;双线性操作计算成本过大,耗时太久;卷积神经网络的中间特征缺乏分辨率,导致错误的结果等等。
Paragraph2:讲述了本文提出的基于经典的声称对抗网络提出的统一的端对端卷积神经网络可以很好的解决上述问题,说明了本文的贡献。

Contributions:

2. Related Work

2.1 Face Detection

人脸检测的方法主要有两种:手工提取特征和卷积神经网络。大多数手动提取特征的处理能力有限,尤其在不受限的环境下性能有限同时计算成本高。
Faster RCNN在FDBB 基准上性能好,而在WIDER FACE数据集上性能下降,原因是与低空间分辨率映射的深度卷积特征用于特征表示,但对于小图像的人脸来说这是不足够的。而resize图像后会出现失真现象,因此探索出super-resolutionrefinement网络。

2.2 Super-resolution and Refinement Network

现有的要实现超分辨率的方法都需要一个核,有个基于CNN的超分辨率方法不适应于自然世界中,有些方法不能有效的去模糊。其中一个去模糊的方法非常依赖于之前的工作,假设的是自然图像的梯度遵循重尾分布。(具体的核还没有理解,待后续学习

2.3 Generative Adversarial Networks

大多数运用于生成超分辨率的生成对抗网络,还是比较模糊并缺乏细节信息。

3. 提出方法

人脸检测系统流程图

3.1 GAN

开始对GAN进行了简单的介绍,并且给出了GAN的基础公式。
关于GAN的介绍详见另外一篇博客,生成对抗网络.
文中作者设计的生成网络,G_{wG}由判别网络D_{\theta D}优化,解决小人脸图片的高分辨率和分类问题,定义如下:

衍生GAN
其中, 网络架构

3.3 损失函数

采用了像素级的损失和对抗损失,用来优化生成网络。移除了VGG的特征匹配损失,引入了分类损失用来驱动生成网络从模糊的图片中恢复细节信息。
像素级的损失,采用MSE损失函数,公式如图所示。


像素级损失

一般来说,在MSE优化问题中经常缺乏高频内容从而导致过度平滑纹理但质量低的图像出现,这也是模糊的原因。
对抗损失,如图所示。


对抗损失
分类损失,如图所示。
分类损失
两个角色:一是在判别网络中判定生成的图像和自然的高分辨率图像中是否包含人脸。二是促进生成网络重建蜕化的图像。

目标函数,如图所示。


目标函数
为了更好的进行梯度化,同时修改了生成损失和判别损失,如图所示。
生成和判别损失

4. 实验

进行了3个大的实验。

5. 结论

通过在WIDER FACE和FDDB数据集上,通过与当前方法的对比,验证了提出方法的有效性。
总是雷声大,雨点小,这一篇论文花了一点点心思,总算总结完了。不过还是内力不足,写出代码进行推敲验证才是王道,修炼内功中……

上一篇 下一篇

猜你喜欢

热点阅读