[paper]The Limitations of Deep Learning in Adversarial Settings(JSMA）

时间 2021-07-12

原文原文链接

与之前的基于提高原始类别标记的损失函数或者降低目标类别标签概率的损失函数的方式不同，这篇文章提出利用输入特征到输出值之间的对抗显著性，达到只需修改少量的输入值即可误分类的目的。换句话说，之前的对抗样本的扰动方向都是损失函数的梯度方向（无论是原始类别标记的损失函数还是目标类别标记的损失函数），该论文生成的对抗样本的扰动方向是目标类别标记的预测值的梯度方向，作者将这个梯度称为前向梯度（forward

>>阅读原文<<