PGD:Towards Deep Learning Models Resistant to Adversarial Attacks

一.摘要 1.出发点:(1)深度网络对对抗攻击(adversarial attack)即对对抗样本的天生缺陷。 (2)当输入信息与自然样本差别并不大是却被网络错误的分类,如下图。 2.作者提出方法和论证如下: (1)从鲁棒优化的角度研究了神经网络的抗差鲁棒性。这与很多最近的相关工作具有广泛的一致性 eg:防御蒸馏,特征压缩。 (2)根据方法的原理性使得该方法在普遍范围内是通用和有效的,即使用最强的
相关文章
相关标签/搜索