2020李宏毅学习笔记——28.Attack ML Models(2_8)

时间 2021-01-02

原文原文链接

1.怎样模拟攻击？即找一张图片，使得loss(cross-entropy loss)越大越好，此时网络的参数训练完了，要被冻住，不能改变，而是只改变输入，使我们找到这样一张图片，能够让结果“越错越好”，离正确答案越远越好。在原图中加入一些噪声，这些噪音不是从高斯分布来的。然后丢到模型里面，会得到不一样的结果。普通的训练模型，x0 输出是y0,交叉熵越小越好训练的目标函数是：L train

>>阅读原文<<