不平衡学习(Imbalanced learning)

数据不平衡 在不少真实场景下,数据集每每是不平衡的。也就是说,在数据集中,有一类含有的数据要远远多于其余类的数据(类别分布不平衡)。在这里,咱们主要介绍二分类中的类别不平衡问题,对于多类别的不平衡只作简单的介绍。算法 考虑一个简单的例子,假设咱们有一个关于医院患者的数据集(里面包含不少患者的图片),咱们把其中患有癌症的病人标记为正例,把健康的患者标记为负例。众所周知,健康的人的数量确定远远大于癌症
相关文章
相关标签/搜索