Spark经常使用函数讲解之键值RDD转换

摘要: RDD:弹性分布式数据集,是一种特殊集合 ‚ 支持多种来源 ‚ 有容错机制 ‚ 能够被缓存 ‚ 支持并行操做,一个RDD表明一个分区里的数据集 RDD有两种操做算子:html         Transformation(转换):Transformation属于延迟计算,当一个RDD转换成另外一个RDD时并无当即进行转换,仅仅是记住       了数据集的逻辑操做          Ati
相关文章
相关标签/搜索