《Spark快速大数据分析》——读书笔记(4)

第4章 键值对操做 键值对RDD一般用来进行聚合计算。咱们通常要先经过一些初试ETL(抽取、转化、装载)操做来将数据转化为键值对形式。 本章也会讨论用来让用户控制键值对RDD在各节点上分布状况的高级特性:分区。css 4.1 动机 pair RDD(包含键值对类型的RDD)提供了并行操做各个键或跨节点从新进行数据分组的操做接口。java 4.2 建立Pair RDD 当须要把一个普通的RDD转为p
相关文章
相关标签/搜索