使用过采样或欠采样处理类别不均衡的数据后,如何正确的做交叉验证?

使用过采样或欠采样处理类别不均衡的数据后,如何正确的做交叉验证? 当我们遇到数据不均衡的时候,我们该如何做: 忽略这个问题 对占比较大的类别进行欠采样 对占比较小的类别进行过采样 忽略这个问题 如果我们使用不均衡的数据来训练分类器,那么训练出来的分类器在预测数据的时候总会返回数据集中占比最大的数据所对应的类别作为结果。分类器的偏差太大,召回率为零或非常接近零,而真假率为1或非常接近于1,即所有或几
相关文章
相关标签/搜索