【NLP复习】数据预处理和特征选择:方差、相关系数、K方检验、互信息、树模型

先拿一张特征工程的导图镇楼。本文主要复习特征工程的核心——特征处理(数据预处理,特征选择,降维)。 一、数据预处理 量纲不统一怎么办?(猫咪的身高和体重) 标准化(前提是特征值服从正态分布,通过算特征的均值和标准差转成标准正态分布) 区间缩放法(利用两个最值进行缩放,将特征取值缩放到某范围,例如[0, 1]等) 标准化与归一化的区别(标准化按特征值,也就是按列;归一化按行搞成单位向量) 定量特征信
相关文章
相关标签/搜索