Spark中RDD 持久化操做 cache与persist区别

环境/背景 Spark 2.3.0 Scala 2.11 Java 1.8java 在进行RDD操做的时候,咱们须要在接下来多个行动中重用同一个RDD,这个时候咱们就能够将RDD缓存起来,能够很大程度的节省计算和程序运行时间。node 接下来能够经过查看Spark的源码对比RDD.cache()与RDD.persist()的差异。web cache 与 persist 对比 首先从JavaRDD类
相关文章
相关标签/搜索