Spark学习笔记

Spark学习笔记 0.RDD:(弹性分布式数据集(resilient/ rɪ'zɪlɪənt] / distributed dataset))。【并行计算】-不可变    RDD 是 Spark 对分布式数据和计算的基本抽象。 1.Spark支持任何实现了Hadoop接口的存储系统。Spark支持的Hadoop输入格式包括文本文件、 SequenceFile、Avro、Parquet等。 2.S
相关文章
相关标签/搜索