文本分类概论

思路历程: 1.利用知识工程建立专家系统进行分类 通过添加特定规则做分类任务,费时费力,覆盖的范围和准确率都非常有限。 2.人工特征工程+浅层分类模型 文本预处理:在文本中提取关键词表示文本 中文文本预处理主要包括 分词 jieba等工具,具体算法参考相关文章 去停用词 维护停用词表(包括高频的代词连词介词等),特征提取过程中删除停用表中出现的词等 文本表示 1.词袋模型(one-hot编码) 缺
相关文章
相关标签/搜索