利用TFIDF策略和朴素贝叶斯算法进行中文文本分类

之前做了一个简单的中文文本分类系统,采用的是朴素贝叶斯的算法,现在回顾一下并详细给出每一个步骤。若有源代码需求,请移步 https://github.com/chenfei0328/BayesProject 一、文本预处理 1.格式问题,比如删空格,删换行符等。 2.jieba分词 https://github.com/fxsjy/jieba 二、建立向量空间模型 1.加载训练集,每一篇文档作为一
相关文章
相关标签/搜索