特征工程2-归一化

为什么要进行数据归一 特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其它的特征, 需要用到一些方法进行无量纲化,使不同规格的数据转换到同一规格 两种常用归一化方法 (1)min-max标准化(线性函数归一化) 定义:即离差标准化,是对原始数据的线性变换,使得结果映射到[0,1]之间,其本质就是将数据变换为[0,1]之间的
相关文章
相关标签/搜索