Spark学习之路(六):深刻剖析与使用RDD的持久化机制和Checkpoint机制

内容简介 1、持久化机制Persist 2、检查点机制Checkpoint 3、持久化与Checkpoint的区别 4、代码演示 5、总结 1、持久化机制Persist 所谓RDD的持久化,其实就是对RDD进行缓存,它是Spark重要的优化手段之一。为何须要对RDD进行缓存呢?这与Spark做业的执行机制有关,咱们知道,Spark程序只有遇到action算子的时候才会执行程序,具体的执行算法大体以
相关文章
相关标签/搜索