spark笔记之RDD的缓存

时间 2021-01-11

原文原文链接

Spark速度非常快的原因之一，就是在不同操作中可以在内存中持久化或者缓存数据集。当持久化某个RDD后，每一个节点都将把计算分区结果保存在内存中，对此RDD或衍生出的RDD进行的其他动作中重用。这使得后续的动作变得更加迅速。RDD相关的持久化和缓存，是Spark最重要的特征之一。可以说，缓存是Spark构建迭代式算法和快速交互式查询的关键。 7.1RDD缓存方式 RDD通过persist方法或ca

>>阅读原文<<

1. spark笔记之RDD的缓存
2. Spark RDD的缓存
3. spark源码阅读笔记RDD（三）RDD的缓存原理
4. spark rdd缓存及缓存清理
5. Spark RDD缓存方式
6. spark笔记之RDD的依赖关系
7. RDD的缓存
8. Spark笔记三之RDD,算子
9. spark笔记之RDD编程API
10. Spark笔记四之RDD处理过程
更多相关文章...
• Hibernate的二级缓存 - Hibernate教程
• Hibernate的一级缓存 - Hibernate教程
• Tomcat学习笔记（史上最全tomcat学习笔记）
• 互联网组织的未来：剖析GitHub员工的任性之源