Spark——Job逻辑执行图

Job逻辑执行图 典型的Job逻辑执行图如上所示,通过下面四个步骤能够获得最终执行结果: 1.从数据源(能够是本地file,内存数据结构, HDFS,HBase等)读取数据建立最初的RDD。 2.对RDD进行一系列的transformation()操做,每个transformation()会产生一个或多个包含不一样类型RDD。 3.对最后的final RDD进行action()操做,每一个part
相关文章
相关标签/搜索