基于信息论的特征选择算法综述

绪论 特征选择的目标是从样本数据集的原始特征F中寻找一个子集S,使得它包含尽量多的类区分信息,即包含更多与类别C有关的知识,同时又使得子集内部的冗余程度尽可能小。定义信息度量函数J(f),其目的是在原始特征集F内选择子集S,保证其与类别C之间相关性程度最大,同时又保证子集S内部的冗余性最小。算法 为了方便起见,下面先对几个经常使用的符号作一简单约定:符号F和S分别表示未选的和已选的特征子集,C表示
相关文章
相关标签/搜索