不均衡学习

1、简介            在不少场景的数据集中,都会出现某一类数据的数量远远多于其它类的数据,通常都是以二分类的类别不平衡问题为主。一个简单的理解,假如某个数据集,10万个正样本(正经常使用户标签为0)与1000个负样本(有问题用户标签为1),正负样本比例为100:1,若是模型学习每一次梯度降低使用全量样本,负样本的权重不到1/100,即便彻底不学习负样本的信息,准确率也有99%,因此实际应
相关文章
相关标签/搜索