聚类算法

聚类算法 聚类的概念: 无监督问题:我们手里没有标签了 聚类:相似的东西分到一组,跟分类问题相似。 刚开始的数据集上没有颜色的标记,也没有告诉我们绿色的是哪些,红色的是哪些,蓝色的是哪些,根据一种相似度度量的方式,把相似的东西归到一类。从图中可以看出,数据集明显被分为3类。 难点:如何评估,如何调参 1. K-MEANS算法 基本概念: 要得到簇的个数,需要指定K值,例如k=3,把数据集聚为3堆。
相关文章
相关标签/搜索