特征工程——一个粗糙调研

1.  数据预处理 通过特征提取,我们能得到未经处理的特征,这时的特征可能有以下问题: 1) 不属于同一量纲:即特征的规格不一样,不能够放在一起比较。  ——无量纲化 无量纲化使不同规格的数据转换到同一规格: 标准化(Z-Score):前提是特征值服从正态分布,标准化后,其转换成标准正态分布。 区间缩放法(min-max标准化):利用边界值信息,将特征的取值区间缩放到某个特定的范围,例如[0, 1
相关文章
相关标签/搜索