Spark常问面试点总结

一、弹性分布式数据集(RDD) 1、RDD介绍 简介:(存放数据的集合,数据是分布式存储的,可以保存在内存或磁盘中。是spark中最基本的数据抽象) RDD(Resilient Distributed Dataset)弹性分布式数据集。 Resilient: 弹性的(可保存在内存或磁盘) Distributed:数据是分布式存储的,便于分布式计算 Dataset: 一个集合,存放数据的 2、RDD
相关文章
相关标签/搜索