Spark面试题

Spark面试题 RDD怎么理解?html RDD 是 Spark 的灵魂,也称为弹性分布式数据集。一个 RDD 表明一个能够被分区的只读数据集。RDD 内部能够有许多分区(partitions),每一个分区又拥有大量的记录(records)。Rdd的五个特征: 1. dependencies: 创建 RDD 的依赖关系,主要 RDD 之间是宽窄依赖的关系,具备窄依赖关系的 RDD 能够在同一个
相关文章
相关标签/搜索