数据挖掘-基于贝叶斯算法及KNN算法的newsgroup18828文本分类器的JAVA实现(上)

(update 2012.12.28 关于本项目下载及运行的常见问题 FAQ见 newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ )java 本文主要内容以下: 对newsgroup文档集进行预处理,提取出30095 个特征词正则表达式 计算每篇文档中的特征词的TF*IDF值,实现文档向量化,在KNN算法中使用算法 用JAVA实现了KN
相关文章
相关标签/搜索