Automated Directed Fairness Testing

Aeqitas有效地生成输入,以发现所有主题分类器中的存在的歧视性,并使用生成的测试输入系统地提高各个模型的公平性。主要创新在于提出了一种新的搜索方法,扩充了原始的训练集。    这篇论文主要是设计可扩展的技术,促进快速发现歧视性的输入。主要思想是首先对输入空间进行随机采样,以发现歧视性输入的存在。然后,我们搜索这些输入的邻域,一般是设置向上和向下的一个单位为基准进行搜索,以发现更多带有歧视性输入
相关文章
相关标签/搜索