Spark 概念学习系列之Spark计算工作流(十二)

下图 中描述了 Spark 的输入、运行转换、输出。   在运行转换中通过算子对 RDD进行转换。   算子是 RDD 中定义的函数,可以对 RDD 中的数据进行转换和操作。        输入:在 Spark 程序运行中,数据从外部数据空间(例如, HDFS、 Scala 集合或数据)输入到 Spark,数据就进入了 Spark 运行时数据空间,会转化为 Spark 中的数据块,通过 Block
相关文章
相关标签/搜索