机器学习数据不均衡问题(转载)

在机器学习任务中,我们经常会遇到这种困扰:数据不平衡问题。        数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时,以总体分类准确率为学习目标的传统分类算法会过多地关注多数类,从而使得少数类样本的分类性能下降。绝大多数常见的机器学习算法对于不平衡数据集都不能很好地工作。        本文介绍几种有效的解决数据不平衡情况下有效训练有监督算法的思路: 1、重新采样训练集   
相关文章
相关标签/搜索