SparkCore

1、RDD:Resilient Distributed DateSet,弹性分布式数据集 五大特性web 是由一系列partition组成 函数做用在每一个partition上 partition之间有一系列依赖关系 分区器做用在K,V格式的RDD上 RDD提供一些列最佳的计算位置 1.默认状况下,一个block对应一个partition 2.RDD并不存储数据,个人理解是:app RDD就是一些
相关文章
相关标签/搜索