Spark学习-基本名词理解

分布式弹性数据集 RDD(Resilient Distribute DataSet) 可以理解为Spark中用于数据处理的基本数据类型。 详见:https://blog.csdn.net/weixin_42078760/article/details/107272921 数据分区 Partition RDD在集群中被切分为多个分区,每个分区单独进行计算。 数据块 Block 每个数据分片在底层存储
相关文章
相关标签/搜索