【文本分类】 特征抽取之信息增益

【文本分类】 特征抽取之信息增益 全文装载: http://www.blogjava.net/zhenandaci/archive/2009/03/24/261701.html 做者:Jasper (from BlogJava)html   在前面的《文本分类概述》文章中,咱们讲到了基于统计学习的方法进行分类的关键在于对训练集语料的特征选择的好坏。那么训练集中哪些词能够做为特征,哪些词则不能呢?咱
相关文章
相关标签/搜索