Spark学习-基本名词理解

分布式弹性数据集 RDD(Resilient Distribute DataSet) 能够理解为Spark中用于数据处理的基本数据类型。web 详见:https://blog.csdn.net/weixin_42078760/article/details/107272921分布式 数据分区 Partition RDD在集群中被切分为多个分区,每一个分区单独进行计算。ide 数据块 Block 每
相关文章
相关标签/搜索