Obfuscated Gradients Give a Fals

2019-08-03  本文已影响0人  winddy_akoky

1. 介绍

  1. shattered gradients are: 破碎梯度是不存在的或不正确的梯度,要么是有意地通过不可微操作造成的,要么是无意地通过数值不稳定造成的.
  2. stochastic gradients: 随机梯度依赖于测试时间的随机性.
  3. vanishing/exploding gradients: 在非常深的计算中,消失/爆炸梯度会导致不可用的梯度。

2. 准备



给定图片x和分类器f(\cdot),对抗样本x^{\prime}满足两个性质:根据某个量化标准,其距离\mathcal{D}\left(x, x^{\prime}\right)必须足够小,且c\left(x^{\prime}\right) \neq c^{*}(x)




3. 混淆梯度

Shattered Gradients

Stochasitc Gradients

Exploding & Vanishing Gradients

3.1 识别混淆梯度和掩码梯度

4. 攻击技术

4.1 向后传播可微估计

4.1.1 一个特殊的例子:The Straight-Through Estimator

4.1.2 广义的攻击:BPDA

4.2 攻击随机化分类器

4.3 重新参数化

5. 案例研究:ICLR 2018 防御

