2020李宏毅学习笔记——28.Attack ML Models(2_8)

1.怎样模拟攻击? 即找一张图片,使得loss(cross-entropy loss)越大越好,此时网络的参数训练完了,要被冻住,不能改变,而是只改变输入,使我们找到这样一张图片,能够让结果“越错越好”,离正确答案越远越好。 在原图中加入一些噪声,这些噪音不是从高斯分布来的。然后丢到模型里面,会得到不一样的结果。 普通的训练模型,x0 输出是y0,交叉熵越小越好 训练的目标函数是:L train
相关文章
相关标签/搜索