特征工程之特征选择

在前一篇文章中我介绍了一些数据预处理的方法,原始数据在通过预处理以后能够被算法处理了,可是实际中可能有一些特征是没有必要的,好比在中国采集的一些数据,那么国籍就都是中国,其实也就没有意义了,反映在统计量上就是方差太小,也就是样本在这个特征上变化很小。还有一种状况是特征和最后的结果相关性很小,也就是这个特征不起做用,衡量这种相关性咱们能够用卡方检验,F-检验以及互信息等。其实不少sklearn的算法
相关文章
相关标签/搜索