中文文本分类

        将文本进行分类是自然语言处理当中最主要的工作之一,本文处理很重要的一项工作就是对文本进行向量化,本文不做详细的介绍,只是采用TF-IDF的方法对文本进行向量化,然后分别采用SVM,  Bayes,  RandomForest,BP四种方法对文本进行分类。 训练语料是在excel中存储的,格式见下图: data = pd.read_excel('../corpus.xlsx', en
相关文章
相关标签/搜索