AT-GAN: A Generative Attack Mode
2020-06-17 本文已影响0人
馒头and花卷
[TOC]
概
用GAN生成adversarial samples, 且不需要样本(AdvGAN需要).
主要内容
在这里插入图片描述AT-GAN的训练过程主要分成俩步, 首先, 生成一个普通的条件GAN, 接着在这个条件GAN的基础上训练一个AT-GAN.
符号说明
: 样本;
:标签;
: 标签为为图像;
:随机噪声;
: 生成器;
: 判别器;
: 分类器;
Original Generator
首先, 我们需要训练一个普通的条件GAN, 为此, 关于的损失函数为
其中是a和b的熵(应该是指交叉熵吧, 当二分类是就是二分类熵). 显然这个损失就是希望生成器生成的图片既真实, 其标签亦为真实的标签.
关于判别器的损失则是
关于分类器的损失则是
注: 三者分别关于最小化(虽然作者没有明讲).
Transfer the Generator
假设由上面的算法生成的生成器为, 并给定我们希望攻破的分类器, 我们要构建一个新的分类器去生成对抗样本. 显然, 需要满足:
- 其生成的样本与真实样本无异, 即
足够小; - 其生成的图像能够骗过目标分类器, 最好是存在一个一一映射, 使得
于是作者构建了俩个损失:
其中是我们给定的可逆函数. 显然的目的是骗过目标分类器, 而的目的是使得生成的样本具有足够的真实性, 另外是额外加入的高斯噪声, 用于柔化距离(?).
于是训练就是最小化下式
注: 的参数初始化为.