【李宏毅】机器学习 笔记12(Attack ML Models)

Attack: 通过在原来的特征值上加上一些杂讯,让network做出错误的判断。 定义attack的loss function: 找到一个与x0很接近的一个x',在x和theta固定的情况下,使输出的答案越错误。 两类constraint:     加了gradient算出的杂讯效果最明显: FGSM: 采用最快的梯度,一次梯度下降得到结果: 主要就是设置一个很大的learning rate使一
相关文章
相关标签/搜索