大数据学习之路80-RDD的存储级别

前面我们说过如果我们想提高spark RDD的执行效率的话,我们可以将常用的RDD cache到内存中这样我们用的话就可以直接拿,执行的效率也会快很多,当然这个cache如果不释放就会一直占用内存的空间。 两次执行rdd2.count的速度明显不一样,第二次的速度会更快 第一次用了3秒,第二次仅用了0.2秒,这都是缓存的功劳 这就是我们的缓存,占用了352B的空间,如果不释放的话就会一直存在。 我
相关文章
相关标签/搜索