聚类分析Kmean

1、聚类的使用 1)事先不知道样本的类别,甚至不知道需要得出的类别个数。 2)样本类别之间有差异性,分类结果能很好地解释预期现象。 3)一般用于数据探索,比如发现群组和离群点检测,还可以作为其他算法的预处理步骤。 2、样本选择: 很多教程都告诉我们基于划分方法的聚类多适用于中等体量的数据集,但我们也不知道“中等”到底有多“中”。通常认为记录数量一般没有限制,与实际应用有关,但样本中记录个数一般要大
相关文章
相关标签/搜索