Spark源码分析之Job触发原理

一 Job的执行流程 1.1 从数据源加载数据,数据源可以是本地数据文件和HDFS文件,也可以你是内存里的数据结构或者HBase等,创建初始的RDD 1.2 对RDD进行一系列的transformation操作,每一个transformation可能产生一个或者多个RDD 1.3 对最后的final RDD进行action操作,触发job操作,将最后每一个分区计算后得到结果 1.4 对每一个分区的
相关文章
相关标签/搜索