一种面向高维数据的集成聚类算法

聚类集成已经成为机器学习的研究热点,它对原始数据集的多个聚类结果进行学习和集成,获得一个能较好地反映数据集内在结构的数据划分。不少学者的研究证实聚类集成能有效地提升聚类结果的准确性、鲁棒性和稳定性。本文提出了一种面向高维数据的聚类集成算法。该方法针对高维数据的特色,先用分层抽样的方法结合信息增益对每一个特征簇选择合适数量比较重要的特征的生成新的具表明意义的数据子集,而后用基于连接的方法对数据子集上
相关文章
相关标签/搜索