spark中持久化和容错checkpoint的区别

他们的目的不一样 1, checkpoint(容错)是考虑安全性,html RDD 可使用 persist() 方法或 cache() 方法进行持久化。数据将会在第一次 action 操做时进行计算,并缓存在节点的内存中。Spark 的缓存具备容错机制,若是一个缓存的 RDD 的某个分区丢失了,Spark 将按照原来的计算过程,自动从新计算并进行缓存。java 2,持久化是为高效性apache 持
相关文章
相关标签/搜索