Spark 十大经常使用的 RDD API (适合小白)

0. RDD是什么?javascript RDD是Spark中的抽象数据结构类型,任何数据在Spark中都被表示为RDD。从编程的角度来看,RDD能够简单当作是一个数组。和普通数组的区别是,RDD中的数据是分区存储的,这样不一样分区的数据就能够分布在不一样的机器上,同时能够被并行处理。所以,Spark应用程序所作的无非是把须要处理的数据转换为RDD,而后对RDD进行一系列的变换和操做从而获得结果。
相关文章
相关标签/搜索