spark===RDD

时间 2021-01-09

原文原文链接

在spark的简介中我们已经说过了，为了让spark的处理速度加快，其中有一个解决办法就是引入了一个分布式的弹性数据集--RDD 那什么是RDD：RDD(Resilient Distributed Dataset）弹性数据集，是spark中的最基本的数据抽象，虽然说RDD是一个数据集，但是，它不存储数据，他表示的是一个不可变的，可分区的元素并行计算的集合，允许用户在执行多个查询时将工作缓存到内存中

>>阅读原文<<

1. SPARK,RDD，RDD算子
2. spark RDD
3. Spark RDD
4. 『 Spark 』4. spark 之 RDD
5. 【Spark】Spark二：Spark RDD初步
6. spark RDD 详解
7. Spark RDD 转化
8. Spark RDD之Partition
9. spark RDD Dataset DataFrame
10. Spark RDD解密
更多相关文章...
• TiDB数据库的应用场景 - NoSQL教程
• 使用Rxjava计算圆周率
• NewSQL-TiDB相关