spark RDD内容总结(适用于复杂的结构)

1.RDD Checkpointing和RDD cache/persist的区别?node 相同点:都须要手动调用方法来保存结果,为了不前面所作的计算工做丢失面试 ,须要把RDD存到缓存或者checkpoint里。json   存放目录的区别缓存 是否自动清除?ide Checkpointing:本身设置目录,目录下面的文件咱们本身来决定是否删除。大数据 cache/persist:只在程序运行时
相关文章
相关标签/搜索