“集体智慧编程”之第三章:“发现群组”的 k均值聚类

分级聚类的缺点 此前学习的分级聚类、与列聚类,有二个缺点: 计算量大,数据越大运行越缓慢。 没有确切的将数据分成不同的组,只是形成了树状图。虽然我倒觉得如果写过多的代码这一点还是可以搞定的。 k均值聚类可以应对上述两种缺点,我们会预先告诉算法生成的聚类数量,也就是我要产生几个类。 原理 如下图所示,对于5个数据项和两个聚类 过程是这样的,先随机产生两个聚类点,那么每一个数据项都会离一其中一个最近,
相关文章
相关标签/搜索