Spark-特征选择(scala)

spark特征选择,基于scala语言编写java ChiSqSelector 特征选择试图识别用来构建模型的相关特征,它减小了特征空间的大小,既能够提升速度又能够提升统计学习行为的结果。 ChiSqSelector实现了卡方特征选择。它可以操做带有不一样种类特征的标签数据。ChiSqSelector利用了卡方独立性检验来决定应该选取哪些特征。它支持三种特征选择模型: (1)numTopFeatu
相关文章
相关标签/搜索