Spark2.0 特征提取、转换、选择之一:数据规范化,String-Index、离散-连续特征相互转换

数据规范化(标准化) 在数据预处理时,这两个术语能够互换使用。(不考虑标准化在统计学中有特定的含义)。 下面全部的规范化操做都是针对一个特征向量(dataFrame中的一个colum)来操做的。 首先举一个例子:web //MaxAbsScaler例子(参考后面MaxAbsScaler部分) //例子:对特征0,特征1,特征2,分别进行缩放,使得值为[-1,1] //例如特征0,其特征向量为[10
相关文章
相关标签/搜索