能够看出来除了KNN之外其余算法都是聚类算法html
1.knn/kmeans/kmeans++区别算法
先给你们贴个简洁明了的图,好几个地方都看到过,我也不知道到底谁是原做者啦,若是侵权麻烦联系我咯~~~~spa
knn模型的三要素:距离度量(如何计算样本之间的距离)、k值的选择(选择要判断的目标周围的几个样本去判断类别)、分类决策规则(如何决定目标的类别).net
图中所谓没有明显的训练过程就是给定目标样本,只须要直接计算其周围K个样本的类别,经过分类决策规则判断出来目标样本的类别就能够,不须要预先训练一个判别模型。htm
Kmeans算法的缺陷blog
- 聚类中心的个数K 须要事先给定,但在实际中这个 K 值的选定是很是难以估计的,不少时候,事先并不知道给定的数据集应该分红多少个类别才最合适
- Kmeans须要人为地肯定初始聚类中心,不一样的初始聚类中心可能致使彻底不一样的聚类结果。(可使用Kmeans++算法来解决)
上面就引出了kmeans++,也就是选择初始种子究竟是哪一个样本时(主要不是选择中心个数,而是人为给定聚类个数,初始化具体哪些样本为初始质心),不是像kmeans那样随机选择,而是:初始的聚类中心之间的相互距离要尽量的远。class
上面这部分主要是参考 https://blog.csdn.net/loadstar_kun/article/details/39450615im
2.其他聚类算法间的区别数据
参考连接 http://blog.sina.com.cn/s/blog_7103b28a0102w4e1.html (我尚未细看,下次再补充~~~~~~~)img