spark建立RDD方式

Spark RDD基本建立所须要的数据源(集合、本地文件、HDFS、Hbase和HiveSQL等)oop    1利用集合建立RDD,就是为了方便测试。测试 调用SparkContext的parallelize()方法进行建立并行化的数据集合。大数据 val arrays =Array(1,3,4,5,6,7,11,29)spa val arrayRDD = sc.parallelize(arra
相关文章
相关标签/搜索