实战文本分类对抗攻击

文章写得比较长,先列出大纲,以便读者直取重点。 “文本分类对抗攻击”是清华大学和阿里安全2020年2月举办的一场AI比赛,从开榜到比赛结束20天左右,内容是主办方在线提供1000条辱骂样本,参赛者用算法逐条扰动,使线上模型将其判别为非辱骂样本,尽量让扰动较小同时又保留辱骂性质(辱骂性质前期由模型判定,最终由人工判定)。 比赛规则 线上模型和评测使用的1000条样本不公开,选手根据赛方指定的接口实现
相关文章
相关标签/搜索