Spark ML中Pipeline、特征转换和决策树分类算法的使用

本文首发于个人我的博客QIMING.INFO,转载请带上连接及署名。node Spark中有关机器学习的库已经在从MLlib往ML逐步迁移了,MLlib库也将在Spark 3.0后中止维护,因此咱们须要尽快熟悉ML库。 在Spark ML库中,核心数据对象由RDD变为了DataFrame,同时,ML库中有一些特征转换的方法,并提供了Pipeline这一工具,可使用户很方便的将对数据的不一样处理组合
相关文章
相关标签/搜索