Spark深刻解析(十三): RDD依赖关系、DAG生成、划分Stage

目录 Lineage 宽窄依赖 如何区分宽窄依赖 为何要设计宽窄依赖 DAG(有向无环图) DAG划分Stage Lineage   RDD只支持粗粒度转换,即在大量记录上执行的单个操做。将建立RDD的一系列Lineage(血统)记录下来,以便恢复丢失的分区。RDD的Lineage会记录RDD的元数据信息和转换行为,当该RDD的部分分区数据丢失时,它能够根据这些信息来从新运算和恢复丢失的数据分区。
相关文章
相关标签/搜索