Spark2.2-persist checkpoint lineage解析

源码版本: 2.2 若有错误请指正 1、背景     Spark中每个RDD都记录它的血缘lineage,根据lineage,咱们能够实现容错机制和数据重用。     相比其余系统的细颗粒度的内存数据更新级别的备份或者LOG机制,RDD的Lineage记录的是粗颗粒度的特定数据Transformation操做(如filter、map、join等)行为。当这个RDD的部分分区数据丢失时,它能够经过L
相关文章
相关标签/搜索