特征抽取--标签与索引的转化: StringIndexer

在机器学习处理过程中,为了方便相关算法的实现,经常需要把标签数据(一般是字符串)转化成整数 索引,或是在计算结束后将整数索引还原为相应的标签。 ​StringIndexer转换器可以把一列类别型的特征(或标签)进行编码,使其数值化,索引的 范围从0开始,该过程可以使得相应的特征索引化,使得某些无法接受类别型特征的算法可 以使用,并提高诸如决策树等机器学习算法的效率。 索引构建的顺序为标签的频率,优
相关文章
相关标签/搜索