Spark系列--SparkCore(五)RDD容错性之cache、persist、checkpoint

1、RDD容错性 理解RDD的容错性:php RDD能够经过血统机制来进行RDD的恢复。在RDD进行转换和动做的时候,会造成RDD的Lineage依赖链,当某一个RDD失效的时候,能够经过从新计算上游的RDD来从新生成丢失的RDD数据。web 可是在spark计算里面,假如计算流程DAG特别长,服务器须要将整个DAG计算完成得出结果,可是若是在这很长的计算流程中忽然中间算出的数据丢失了,spark
相关文章
相关标签/搜索