Python机器学习 聚类算法K-MEANS DBSCAN

聚类概念: 无监督问题:我们手里没有标签了 难点:如何评估,如何调参 聚类:相似的东西分到一组   K-MEANS算法 基本概念: 要得到簇的个数,需要指定K值 距离的度量:常用欧几里得距离和余弦相似度(先标准化) 优化目标: 工作流程:        (1)从数据中随机选择k个对象(如三分类,K=3)作为初始聚类中心;   (2)计算每个聚类对象(样本)到聚类中心(随机选择的点)的距离来划分;
相关文章
相关标签/搜索