盒马唠机器学习之聚类算法

        聚类是数据挖掘中的概念,就是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离。         对于聚类算法有两难点,一是如何评价这个数据聚类也就是分蔟分得比较好,因为是无监督的学习你不知道这个数据该分成几类,而且类间成员是
相关文章
相关标签/搜索