spark rdd缓存及缓存清理

首先咱们看看官方的定义和用法介绍html RDD Persistence(持久化)java Spark 中一个很重要的能力是将数据persisting持久化(或称为caching缓存),在多个操做间均可以访问这些持久化的数据。当持久化一个 RDD 时,每一个节点的其它分区均可以使用 RDD 在内存中进行计算,在该数据上的其余 action 操做将直接使用内存中的数据。这样会让之后的 action
相关文章
相关标签/搜索