样本不均衡问题

在分类问题中,经常会遇到训练数据类别不均衡的情况。比如在安防监测问题中,绝大部分的样本均为正常人群,可用的坏人样本相当稀少。如果拿全量样本去训练一个简单的高准确率的二分类模型,那结果毫无疑问会严重偏向于正常人群,从而导致模型的失效。 本文从改善采样方式、模型和评价指标等角度出发,来介绍适用于各种场景下的解决样本不均衡问题的方法。 一、 采样 采样的目的就是使得各类样本均衡。这里称数据充分的类为丰富
相关文章
相关标签/搜索