[paper]UPSET and ANGRI:Breaking High Performance Image Classiﬁers

时间 2021-07-11

原文原文链接

提出了两种攻击算法，第一种是针对输出类别生成通用扰动（定向攻击），第二种针对不同图像生成特定扰动（定向攻击）。 UPSET:Universal Perturbations for Steering to Exact Targets UPSET网络为针对原始图像生成具有通用扰动的对抗样本，且可以使模型误分类为指定的目标类别。 x x x：原始图像 t t t ：目标类别 x ^ \hat{x} x^