如何在不平衡类上使用机器学习?

什么也不做。有时好运就这样降临在你的头上:你什么都不需要做。你可以使用所谓的自然(或分层)分布来进行训练,有时不需任何修改就能正常运行。 通过某些方法使得数据更加平衡: 对少数类进行过采样 对多数类进行欠采样 合成新的少数类 舍弃所有少数类,切换成一个异常检测框架。 在算法层面之上(或之后): 调整类的权重(错误分类成本) 调整决策阈值 使已有的算法对少数类更加敏感 构造一个在不平衡数据上表现更好
相关文章
相关标签/搜索