Spark独到见解--2总技术栈见解之SparkCore

  1) RDD      1) 概念           RDD(Resilient Distributed Dateset),弹性分布式数据集。       2) RDD的五大特性:           1.   RDD是由一系列的partition组成的。           2.   函数是作用在每一个partition(split)上的。           3.   RDD之间有一些列
相关文章
相关标签/搜索