Spark入门篇——RDD的血缘

目录 RDD的血缘 概述 划分依赖的背景 划分以来的依据 窄依赖 宽依赖  join的依赖 宽依赖  窄依赖  依赖与Stage的划分 Stage的类别  依赖与容错 转换算子中间发生失败 DAG的生成 总结 RDD的血缘 概述 RDD可以从本地集合并行化、从外部文件系统、其他RDD转化得到,能从其他RDD通过Transformation创建新的RDD的原因是RDD之间有依赖关系(Dependen
相关文章
相关标签/搜索