不平衡数据研究

不平衡数据 不平衡数据的表现: 较少的正样本数,并且具有最少实例数的类通常是学习任务的兴趣类。 正负样本交替重叠(如图a) 小的不相连的样本(如图b) 不平衡数据的处理方法主要有: 数据层面:通过对数据进行预处理来减少类不平衡对于分类的影响——随机过采样、随机欠采样、综合采样 算法层面:通过设计新算法或改进已有算法来解决类不平衡问题 代价敏感学习:该方法介于数据层面和算法层面之间,它包含了数据层面
相关文章
相关标签/搜索