Spark学习三:Pair RDD的创建、转化、行动和缓存操作

Pair RDD是指中每一个元素都是(key,value)形式,通常用来进行聚合运算。非Pair RDD一般通过ETL(抽取、转换、加载)将数据转为Pair RDD形式。 1. 创建Pair RDD 常用的函数如下: 2. 转化操作 Spark学习二:RDD的创建、转换、求值和缓存操作中的转化操作针对Pair RDD都可用,只是在传递的函数中需要操作的参数是二元组而不是独立的参数,除此之外,还有如
相关文章
相关标签/搜索