spark 对 RDDs的基础操做 整理

写在前面:学习spark有近一个月,暂时补充RDDs算子方面的知识,每周日更新!加油!缓存   1.RDDs:spark的主要抽象--弹性分布式数据集 RDDs的分布式能够体如今:它可被分发到集群各个节点上进行并行操做,最后将结果合并返回。 弹性体如今:spark在对RDDs操做时会自动的进行内存和磁盘数据存储的权衡和切换。          spark基于Lineage(血统关系图,下面会讲)的
相关文章
相关标签/搜索