文本分类项目总结

摘抄:https://zhuanlan.zhihu.com/p/25928551(原文地址) 一.传统文本分类 1)文本预处理 文本预处理过程是在文本中提取关键词表示文本的过程,中文文本处理中主要包括文本分词和去停用词两个阶段。 2)文本表示和特征提取 文本表示: 传统做法常用词袋模型(BOW, Bag Of Words)或向量空间模型(Vector Space Model),最大的不足是忽略文本
相关文章
相关标签/搜索