对于sortBy算子的一些理解

时间 2020-12-20

原文原文链接

package day03 import org.apache.spark.{SparkConf, SparkContext} /** * RanagePartitioner采用的是"水塘抽样"算法,可以对数据进行相对均匀的分配 * 原理是,.在分配之前对数据进行抽样 * * 与hashPartitioner不同的是,hashPartitioner是根据key取HashCode