实战文本分类对抗攻击

时间 2021-01-03

原文原文链接

文章写得比较长，先列出大纲，以便读者直取重点。 “文本分类对抗攻击”是清华大学和阿里安全2020年2月举办的一场AI比赛，从开榜到比赛结束20天左右，内容是主办方在线提供1000条辱骂样本，参赛者用算法逐条扰动，使线上模型将其判别为非辱骂样本，尽量让扰动较小同时又保留辱骂性质（辱骂性质前期由模型判定，最终由人工判定）。比赛规则线上模型和评测使用的1000条样本不公开，选手根据赛方指定的接口实现

>>阅读原文<<