机器学习-类别不平衡问题

一、类别不平衡          类别不平衡(class-imbalance)是指分类任务中不同类别的训练样例数目差别很大的情况。比如说一个二分类问题,1000个训练样本,比较理想的情况是正类、负类样本的数量相差不多;而如果正类样本有998个、负类样本仅2个,就意味着存在类不平衡。那么学习方法只需返回一个永远将新样本预测为反例的学习器,就能达到99.8% 的精度;然而这样的学习器往往没有价值,因为
相关文章
相关标签/搜索