[paper]Universal adversarial perturbations

本文提出了计算自然图像中普遍扰动的算法,在神经网络上具有很好的泛化性,并且揭示了模型在高维空间中决策边界的几何联系。并且说明了在输入空间中存在单个方向的潜在安全漏洞,攻击者可能会利用这些漏洞造成模型对大多数自然图像分类错误。 universal 算法: μ \mu μ是图像分布 v v v是universal扰动 k ^ \hat{k} k^是模型 universal扰动 v v v需要满足两个条
相关文章
相关标签/搜索