spark五 缓存和检查点

—— 可以在内存中持久化或缓存多个数据集。当持久化某个RDD后,每一个节点都将把计算的分片结果保存在内存中,并在对此RDD或衍生出的RDD进行的其他动作中重用,一方面提高效率,另一方面内存加快速度 缓存 cache persist 发现cache最终也是调用了persist方法 遇到的问题 memory_only 3个g,内存只有2g,缓存2g,用到它是找缓存,发现缓存不够,就重新计算 check
相关文章
相关标签/搜索