机器学习算法原理系列篇15: 聚类算法

聚类算法不需要用户提供数据的标签,是最常用的一类无监督机器学习方式。 简单来说,聚类算法就是把数据分组。好的聚类算法达到的效果就是,相同组的数据会展现相似的性质,而不同组的数据特征分布会不大相同。通常而言需要聚类的数据特征繁多,因此数据处于高维空间,我们需要首先定义距离,从而比较不同数据点之间的距离。距离相近的数据就可能被划分到同一个组。       上图给出了一个简单的聚类问题,我们如何通过身高
相关文章
相关标签/搜索