scala-MLlib官方文档---spark.mllib package--clusteirng

时间 2020-08-12

标签 scala mllib 官方文档 spark.mllib spark package clusteirng 栏目 Scala 繁體版

原文原文链接

5、Clustering 聚类是一个无监督的学习问题，咱们旨在基于类似性的概念将实体的子集彼此分组。聚类一般用于探索性分析和/或做为分级监督学习管道的组成部分（在该学习管道中，针对每一个聚类训练不一样的分类器或回归模型）。web k-means K均值是最经常使用的聚类算法之一，它将数据点汇集成预约数量的聚类。 spark.mllib实现包括k-means ++方法的并行变体，称为kmeans |

>>阅读原文<<