初识sparkCore

1、概念 RDD(Resilient Distributed Dataset),弹性分布式数据集 ,是分布式内存的一个抽象概念。mysql 2、RDD的五大特性       一、RDD是由一系列的partition组成的。算法         partition通常有三种方式产生sql     (1)从Scala集合中建立,经过调用SparkContext#makeRDD或SparkContext
相关文章
相关标签/搜索