Spark源码分析-SortByKey源码

时间 2021-08-15

标签大数据 Spark spark sortBykey源码栏目 Spark 繁體版

原文原文链接

简单介绍 SortByKey对<key, value>数据进行按照key进行排序，怎么个排法，我么先看一下spark源码中的一些注释: 两段注释的基本意思差不多：通过RDD的key进行排序，每一个分区包括在一个范围内排好序的元素，然后返回一个有序的list集合，或者按照该key以part-x的形式保存在文件系统上。大概的意思就是这样，就是按照partition排好序，然后返回。

>>阅读原文<<