面向高维和不平衡数据分类的集成学习研究论文研读笔记

高维不平衡数据的特征(属性)较多,类标号中的类别分布不均匀的数据。  高维数据分类难本质问题: 1.密度估计难问题; 2.维数灾难:特征数增加意味着分类所需的样本数量的增加; 3.Hughes问题:给出了一个广义上的数据测量复杂度,训练样本数量和分类精度三者间的关系即对有限样本而言,存在一个最优的数据复杂度,可使分类精度达到最优。若数据特征数很多,量过精度过高,都会导致分类精度下降。 分类中的数据
相关文章
相关标签/搜索