spark(二) rdd具体介绍

spark(二) rdd具体介绍 看完这篇 你可以学到一下内容 1:掌握RDD的原理 2:熟练使用RDD的算子完成计算任务 3:掌握RDD的宽窄依赖 4:掌握RDD的缓存机制 5:掌握划分stage 6:掌握spark的任务调度流程 rdd是什么呢? RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、
相关文章
相关标签/搜索