Spark学习之路——9.Spark ML

一、简介 基于RDD的API spark.mllib已进入维护模式。 Spark ML是Spark MLlib的一种新的API,它有下面的优点: 1.面向DataFrame,基于RDD进一步封装,拥有功能更多的API 2.具有Pipeline功能,可以实现复杂的机器学习模型 3.性能得到提升 二、ML Pipeline 一个pipeline 在结构上会包含一个或多个Stage,每一个 Stage
相关文章
相关标签/搜索