spark的RDD中的action(执行)和transformation(转换)两种操做中常见函数介绍

spark的RDD中的action(执行)和transformation(转换)两种操做中常使用的函数html (1) 弹性分布式数据集(RDD)         Spark是以RDD概念为中心运行的。RDD是一个容错的、能够被并行操做的元素集合。建立一个RDD有两个方法:在你的驱动程序中并行化一个已经存在的集合;从外部存储系统中引用一个数据集。RDD的一大特性是分布式存储,分布式存储在最大的好处
相关文章
相关标签/搜索