数据挖掘之特征选择

by wangben @ beijing 数据挖掘之特征选择 特征选择的主要目的有两点: 1. 减少特征数量提高训练速度,这点对于一些复杂模型来说尤其重要 2. 减少noisefeature以提高模型在测试集上的准确性。一些噪音特征会导致模型出现错误的泛化(generalization),从而在测试集中表现较差。另外从模型复杂度的角度来看,特征越多模型的复杂度越高,也就越容易发生overfitti
相关文章
相关标签/搜索