[paper]UPSET and ANGRI:Breaking High Performance Image Classifiers

提出了两种攻击算法,第一种是针对输出类别生成通用扰动(定向攻击),第二种针对不同图像生成特定扰动(定向攻击)。 UPSET:Universal Perturbations for Steering to Exact Targets UPSET网络为针对原始图像生成具有通用扰动的对抗样本,且可以使模型误分类为指定的目标类别。 x x x:原始图像 t t t :目标类别 x ^ \hat{x} x^
相关文章
相关标签/搜索