spark RDD持久化

spark RDD持久化 简介 spark是分布式基于内存的数据处理引擎,它的一个基本功能是将RDD持久化到内存中。巧妙使用RDD持久化,甚至在某些场景下,能够将spark应用程序的性能提高10倍。对于迭代式算法和快速交互式应用来讲,RDD持久化,是很是重要的。html cache和persist spark有cache和persist两种方持久化方法。java # RDD.scala部分源码
相关文章
相关标签/搜索