Spark RDD API详解(一) Map和Reduce

本文由cmd markdown编辑,原始连接:https://www.zybuluo.com/jewes/note/35032 RDD是什么? RDD是Spark中的抽象数据结构类型,任何数据在Spark中都被表示为RDD。从编程的角度来看,RDD能够简单当作是一个数组。和普通数组的区别是,RDD中的数据是分区存储的,这样不一样分区的数据就能够分布在不一样的机器上,同时能够被并行处理。所以,Spa
相关文章
相关标签/搜索