那些年我们玩过的Spark下的Standalone集群模型

内存模型 RDD(弹性分布式数据集) RDD的五大特性 a list of partiotioner。一组分区。partiotioner是一个抽象概念,指的是一片连续的空间,顾名思义一个RDD包含一组连续的空间。 a function for partiotioner 每一个partiotioner都有着一个函数对其进行运算。这也是spark并行计算的基础。 a list of dependenc
相关文章
相关标签/搜索