Spark编程模型经典解析(二)

创建RDD 方式一:从集合创建RDD ● makeRDD ● Parallelize ● 注意:makeRDD可以指定每个分区perferredLocations参数,parallelize则没有。 方式二:读取外部存储创建RDD Spark与Hadoop完全兼容,所以对Hadoop所支持的文件类型或者数据库类型,Spark同样   支持。 ● 多文件格式支持: ● 多文件系统支持: 1) 本地文
相关文章
相关标签/搜索