四:RDD之--Pair RDD

RDD之--Pair RDD 1. Pair RDD介绍 (1)Pair RDD是以Key-Value形式存在的数据。对于现实生活中的一些数据需要以键值对的形式存在(比如统计每个产品的评论,将数据中键相同的分为一组)。 (2)spark为包含键值对类型的RDD提供了一些专有的操作(这样的RDD称为:Pair RDD)。另外,Pair RDD提供了并行操作对各个键或跨节点重新进行数据分组的操作接口。
相关文章
相关标签/搜索