Spark 持久化(cache和persist的区别)

个人原创地址:https://dongkelun.com/2018/06/03/sparkCacheAndPersist/java 一、RDD 持久化 Spark 中一个很重要的能力是将数据持久化(或称为缓存),在多个操做间均可以访问这些持久化的数据。当持久化一个 RDD 时,每一个节点的其它分区均可以使用 RDD 在内存中进行计算,在该数据上的其余 action 操做将直接使用内存中的数据。这样
相关文章
相关标签/搜索