聚类和EM算法

聚类是一种无监督学习,它通过对无标记训练样本的学习来寻找这些数据的内在性质。 聚类的思想:将数据集划分为若干个不相交的子集(簇),每个簇对应一类,但通常聚类算法不会告诉你这些簇分别代表什么意义,只是这样分成这些不相交的簇。 聚类的作用: 作为一种探索性分析方法,分析数据的内在性质,寻找数据的分布规律 作为分类的预处理过程,并不直接数据分析,首先对需要分类的数据进行聚类,然后对聚类出的结果的每个簇上
相关文章
相关标签/搜索