机器学习笔记(3)——使用聚类分析算法对文本分类(分类数k未知)

聚类分析是一种无监督机器学习(训练样本的标记信息是未知的)算法,它的目标是将类似的对象归到同一个簇中,将不类似的对象归到不一样的簇中。若是要使用聚类分析算法对一堆文本分类,关键要解决这几个问题:python 如何衡量两个对象是否类似 算法的性能怎么度量 如何肯定分类的个数或聚类结束的条件 选择哪一种分类算法  下面就带着这几个问题,以我工做中的一个业务需求为例,来学习一下怎么对中文文本进行聚类。(
相关文章
相关标签/搜索