Spark核心编程-RDD持久化详解

1、不使用RDD持久化 2、使用RDD持久化 3、持久化对于性能调优的原则 尽可能去复用RDD,差很少的RDD,能够抽取称为一个共同的RDD,供后面的RDD计算时,反复使用。 公共RDD必定要实现持久化,对于要屡次计算和使用的公共RDD,必定要进行持久化。 持久化,也就是说,将RDD的数据缓存到内存中/磁盘中,之后不管对这个RDD作多少次计算,都是直接取这个RDD的持久化的数据,好比从内存中或者磁
相关文章
相关标签/搜索