Spark学习—PairRDD编程

 PairRDD:键值对RDD,其是Spark中转化操做经常使用的数据类型。上一篇文件《》咱们就使用了PairRDD。PairRDD是不少程序的构成要素,由于他提供了并行操做或跨节点从新进行数据分组的操做接口。本文将结合Java示例讲解PairRDD相关接口操做。 一. PairRDD建立 不少存储键值对的数据格式会在读取时直接返回其键值对数据组成的pair RDD,同时也能够调用map()函数来
相关文章
相关标签/搜索