基于svm的中文文本自动分类系统

今天刚改完成了软件工程的大作业展示,即:基于内容的文本分类系统,使用libsvm 进行分类。在百度谷歌了很久之后,发现很少有这样的源码可以下载,本人便想着写完之后上传上去。 首先介绍一下流程: 1.先使用中科院的分词器ICTLAS对训练集进行分词 2.将所有的词构建成一个字典,以label item的形式,后面svm要用到。如:1 中国 3.提取特征词,由于并不是每个词都是有用的,因此要提取出特征
相关文章
相关标签/搜索