建立RDD和RDD的持久化

建立RDD的方式 第一种:经过并行化的方式建立RDDweb val arr = Array(1,2,3,4,5,6,7) val rdd = sc.paralleize(arr,4) //并行化程度是4 //默认是根据集群的状况来设置分区,建议一个cpu分2-4个partition 第二种方式:使用本地文件或者HDFS建立RDD textfile来读取文件建立RDD,默认状况下每个Block建立一
相关文章
相关标签/搜索