利用TFIDF策略和朴素贝叶斯算法进行中文文本分类

时间 2021-01-01

标签 TF-IDF算法朴素贝叶斯文本分类 python 栏目 Python 繁體版

原文原文链接

之前做了一个简单的中文文本分类系统，采用的是朴素贝叶斯的算法，现在回顾一下并详细给出每一个步骤。若有源代码需求，请移步 https://github.com/chenfei0328/BayesProject 一、文本预处理 1.格式问题，比如删空格，删换行符等。 2.jieba分词 https://github.com/fxsjy/jieba 二、建立向量空间模型 1.加载训练集，每一篇文档作为一

>>阅读原文<<