西瓜书第3章之类别不平衡问题

西瓜书第3章之类别不平衡问题 3.5类别不平衡问题 类别不平衡是指分类任务中不同类别数目差距大。 例如负样本与正样本比为10:1。 3.5.1解决类别不平衡-欠采样(下采样) 减少负样本的训练集,使正样本与负样本接近。 代表算法:EasyEnsemble 原理:将负样本随机取出与正样本数目接近集合,组成训练集用于训练。重复以上多次产生多个基分类器。将各个基分类器集成输出最终决策。 3.5.1解决类
相关文章
相关标签/搜索