spark机器学习-聚类

聚类算法是一种无监督学习任务,用于将对象分到具备高度类似性的聚类中,聚类算法的思想简单的说就是物以类聚的思想,相同性质的点在空间中表现的较为紧密和接近,主要用于数据探索与异常检测,最经常使用的一种聚类算法是K均值(K-means)聚类算法 算法原理 kmeans的计算方法以下: 1 选取k个中心点 2 遍历全部数据,将每一个数据划分到最近的中心点中 3 计算每一个聚类的平均值,并做为新的中心点 4
相关文章
相关标签/搜索