机器学习课程笔记---聚类

应用 评价指标 距离 k-means算法 前提要选取k个点 重心点不变了就可以。 存在的问题 1、初始点 2、k,从1开始试,慢慢增加,看趋势 聚类之前需要做的事 !!!一定要归一化,不同维度的值统一到一个范围中。 以及均值中心化。 2、k-means++ 这里的概率就是用轮盘赌算法 对于数值型的,可以算距离;对于离散的属性,怎么算距离? K-prototype 为了防止分类距离对整体距离的影响
相关文章
相关标签/搜索