聚类算法简介(一)——kmeans算法

聚类不同于分类,分类是人已经知道如何分类 有了分类 机器对人类的操作学习之后自动分类 如:垃圾邮件;而聚类 算法根据数据的相似性自己去判断 事先没有分类 聚类算法包括: 1.K-means(无监督学习) 特点:运算快、简单、好理解 但是只能应用于连续型数据 并且在分类前指定要选哪几类,非球形簇有局限 算法理解: 先指定要分几个组 在数据集中随机选几个数据点作为质心 计算其余点与质心的距离 哪个近跟
相关文章
相关标签/搜索