机器学习中的特征选择(过滤式,包裹式,嵌入式)

  1 Intro 从给定的特征集合中选择出相关特征子集的过程,称为“特征选择”。特征选择是一个重要的数据预处理过程,进行特征选择的原因如下: 减少特征数量、降维,使模型泛化能力更强,减少过拟合; 去除不相关特征,降低学习难度。 常见的特征选择方法大致可以分为三类:过滤式、包裹式和嵌入式。 2 过滤式 过滤式方法先对数据集进行特征选择,然后再训练学习器。特征选择过程与后续学习器无关,这相当于先对初
相关文章
相关标签/搜索