Spark系列五:键值对RDD

Spark系列四: 基本RDD----行动操作 键值对RDD通常用来进行聚合计算。 一般通过一些初试ETL(抽取、转化、装载)操作来将数据转化为键值对形式。 Spark为包含键值对类型的RDD提供了一些专有的操作,这些RDD被称为pairRDD, 我们通常从一个RDD中提取某些字段(如代表事件时间、用户ID 或者其他标识符的字段),并使用这些字段作为pairRDD操作中的键。 pairRDD提供了
相关文章
相关标签/搜索