大前端开发

人脸造假检测论文(一)

2022-06-07  本文已影响0人  Zachary_169f

姓名:张钰  学号:21011210154  学院:通信工程学院

【嵌牛导读】Multi-attentional Deepfake Detection论文阅读笔记

【嵌牛鼻子】Deepfake人脸检测方法

【嵌牛提问】如何实现伪造检测,有何创新点

【嵌牛正文】
转自:https://blog.csdn.net/qq_43687860/article/details/124854122

一、论文信息:

二、背景与创新:

注意区域被分离并响应不同的区别特征

三、网络结构

3.1 overview

本文作者提出的多注意力网络框架如下图表示:


多注意力网络框架

三个关键组件集成到主干网络中:

3.2 方法

1、多注意力图

2、纹理增强

3、双线性注意力池化(BAP)

通过叠加Vk得到纹理特征矩阵P ∈R^{M×C_F},然后送进分类器。

3.3 注意力图正则化的区域独立性损失

于缺乏细粒度级别的标签,所以容易陷入网络降级的情况。即不同的注意力图往往集中在同一区域,这不利于网络捕捉给定输入的丰富信息。作者希望每个注意力图都位于固定的语义区域。所以提出一个区域独立性损失,以减少特征图之间的重叠,并保持不同输入的一致性。通过中心损失,区域独立性损失定义如下:
其中B是批大小,M是注意力的数量,Min表示特征与相应的特征中心之间的边界,并且随着Yi是0还是1而变化,Mout是每个特征中心之间的边界,其中C被定义为:
其中 α为特征中心的更新速率,每个epoch都衰减它。
L_RIL的第一部分是类内loss,目的是为了将V逼近特征中心c,第二部分是类间loss,排斥分散的特征中心。作者将这种区域独立性损失与传统的交叉熵损失相结合,Lce为交叉熵损失,λ1=λ2=1,最后Loss被定义为:

3.4 注意力引导的数据增强

为了让不同的注意力图注意不同的区域,作者提出了注意力引导的数据增强的方法。

注意力图Ak 经过归一化以后得到Ak∗∈R_H × W,然后利用高斯模糊生成一个退化的图片,最后再利用Ak∗作为权重来退化原始图片.
作用:
  1. 该方法可以对某些区域进行模糊化处理,保证模型能够从其他区域学习到更为稳健的特征;
  2. AGDA可以偶然删除最显著的区分区域,强制Attention map关注在不同的区域(不同的标签);
  3. AGDA机制可以防止单个关注区域过度扩展,并鼓励关注块探索各种关注区域划分形式。

四、实验

实验细节

  1. 采用EfficientNet-b4作为backbone network,包括7层主要的层在EfficientNet中,分别用L1-L7表示。由于观察到细微的伪影倾向于被网络较浅层的纹理特征所保留,所以选择L2和L3。
  2. FF++数据集训练,celeb-DF跨数据集评估:
FF++数据集 Cross-dataset Number of attention maps
上一篇 下一篇

猜你喜欢

热点阅读