Spark控制算子

Spark控制算子 1. 控制算子分类 Spark中控制算子也是懒执行的,须要Action算子触发才能执行,主要是为了对数据进行缓存。缓存 cache(),persist(),checkpoint()算子app 其中【cache () = persist()=persist(StorageLevel.Memory_Only)】学习 以上算子均可以将RDD持久化,持久化的最小单位是partition
相关文章
相关标签/搜索