大数据框架-spark

  相关详细说明:https://www.csdn.net/article/2015-07-10/2825184 RDD:弹性分布式数据集。 Operation:Transformation 和Action,一个返回RDD,一个返回值。 Lineage:RDD之间的依赖关系,如何演变过来。 Partition:RDD分区,按block切分 narrow dependency(窄依赖) :父RDD全
相关文章
相关标签/搜索