文本特征选择之互信息和卡方

参考:http://www.cnblogs.com/fengfenggirl/p/text_feature_selection.htmlhtml 在作文本挖掘,特别是有监督的学习时,经常须要从文本中提取特征,提取出对学习有价值的分类,而不是把全部的词都用上,所以一些词对分类的做用不大,好比“的、是、在、了”等停用词。这里介绍两种经常使用的特征选择方法:学习 互信息atom   一个经常使用的方法是
相关文章
相关标签/搜索