不平衡数据的数据处理方法（F值）

时间 2020-12-24

原文原文链接

在机器学习中，不平衡数据是常见场景。不平衡数据一般指正样本数量远远小于负样本数量。如果数据不平衡，那么分类器总是预测比例较大的类别，就能使得准确率达到很高的水平。比如正样本的比例为 1%，负样本的比例为 99%。这时候分类器不需要经过训练，直接预测所有样本为负样本，准确率能够达到 99%。经过训练的分类器反而可能没有办法达到99%。对于不平衡数据的分类，为了解决上述准确率失真的问题

>>阅读原文<<