特征选择 (feature_selection)

当数据预处理完成后,咱们须要选择有意义的特征输入机器学习的算法和模型进行训练。一般来讲,从两个方面考虑来选择特征:html 特征是否发散:若是一个特征不发散,例如方差接近于0,也就是说样本在这个特征上基本上没有差别,这个特征对于样本的区分并无什么用。 特征与目标的相关性:这点比较显见,与目标相关性高的特征,应当优选选择。除移除低方差法外,本文介绍的其余方法均从相关性考虑。 根据特征选择的形式又能够
相关文章
相关标签/搜索