Spark编程模型(中)

创建RDD 方式一:从集合创建RDD makeRDD Parallelize 注意:makeRDD可以指定每个分区perferredLocations参数parallelize则没有。 方式二:读取外部存储创建RDD   Spark与Hadoop完全兼容,所以对Hadoop所支持的文件类型或者数据库类型,Spark同样支持。 多文件格式支持: 多文件系统支持:    1)本地文件系统    2)S
相关文章
相关标签/搜索