用R语言实现文本挖掘(tm)、聚类

最近由于写毕业论文,想要找找怎样可以识别不相干方法评论,结果看到了R语言中使用K-mean聚类,能够查看不在聚类范围类的,输出异常的评论。因为K-mean聚类是针对数值型数据的,因此在运用K-mean聚类算法对文本进行主题聚类时,须要经历分词、词向量、文档-词矩阵等,用到了几个包。我原先针对这部分的文本分析主要时用Python中的结巴工具分词、提出关键词、LDA主题分类等方法。今天想要试试用R语言
相关文章
相关标签/搜索