spark总结

1、什么是RDD? RDD的5大特性。     RDD是spark中的一种抽象,他是弹性分布式数据集.     a) RDD由一系列的partition组成     b) 算子作用在partition上     c) RDD之间具有依赖关系     d) partition提供了最佳计算位置(体现了移动计算不移动数据思想)     e) 分区器作用在K、V格式的RDD上。     哪里体现了弹性、
相关文章
相关标签/搜索