【腾讯TMQ】机器学习之一:聚类实战

导读 可预见的未来数据分析和机器学习将成为工作中必备技能,也许已经在某个项目中讨论怎么调参优化,就像过去讨论如何优雅的写python、如何避免C++内存泄露一样常见。 一、简单介绍聚类算法 1、聚类的定义 聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。 2、聚类的基本思想 给定一个有N个对象的数据集,构造数据的k个簇,k
相关文章
相关标签/搜索