Spark系列--SparkCore(四)RDD的依赖关系及运行规划

本篇以WordCount为例,去分析RDD的依赖关系和任务切分机制,分析样例以下:web sc.textFile(“xx") .flatMap(_.split(" ")) .map((_,1)) .reduceByKey(_+_) .saveAsTextFile(“xx") 1、RDD的依赖关系 RDD的依赖分为两种:窄依赖、宽依赖svg 窄依赖指的是每个父RDD的
相关文章
相关标签/搜索