spark学习笔记之一:RDD的五大特性

1.A list of partitions RDD是一个由多个partition(某个节点里的某一片连续的数据)组成的的list;将数据加载为RDD时,通常会遵循数据的本地性(通常一个hdfs里的block会加载为一个partition)。 2.A function for computing each split RDD的每一个partition上面都会有function,也就是函数应用,其做
相关文章
相关标签/搜索