Spark的cache与checkpoint优化

1.SPARK中一些通用的或者重要的RDD最好是作一个cache缓存,缓存到内存或者硬盘中,这样下次用到这个RDD数据的时候就不用从头开始计算了,直接从缓存读取便可!缓存 2因为某种缘由也可能咱们用cache或者Persist缓存的RDD数据,也可能会出现缓存这些数据的一部分机子忽然挂掉等,若是此时还想更保险的保存该RDD的结果,最好就checkpoint一下,将checkpointDir设置为H
相关文章
相关标签/搜索