Spark MLlib 特征抽取、转化和选择 -- 特征变换: 标签和索引的转化

这一部分主要介绍和特征处理相关的算法,大体分为以下三类: 1)特征抽取:从原始数据中抽取特征 2)特征转换:特征的维度、特征的转化、特征的修改 3)特征选取:从大规模特征集中选取一个子集 在机器学习处理过程中,为了方便相关算法的实现,经常需要把标签数据(一般是字符串)转化成整数索引,或是在计算结束后将整数索引还原为相应的标签。 Spark ML包中提供了几个相关的转换器,例如:StringInde
相关文章
相关标签/搜索