scala-MLlib官方文档---spark.mllib package--clusteirng

5、Clustering 聚类是一个无监督的学习问题,咱们旨在基于类似性的概念将实体的子集彼此分组。聚类一般用于探索性分析和/或做为分级监督学习管道的组成部分(在该学习管道中,针对每一个聚类训练不一样的分类器或回归模型)。web k-means K均值是最经常使用的聚类算法之一,它将数据点汇集成预约数量的聚类。 spark.mllib实现包括k-means ++方法的并行变体,称为kmeans |
相关文章
相关标签/搜索