Spark(java)二次排序

#楔子 学习《数据算法 Hadoop Spark大数据处理技巧》中Spark部分 1 二次排序:简介 ​ 二次排序(secondary sort) 问题是指归约阶段与某个键关联的值排序。有时这也称为值键转换(value-key conversion)。利用二次排序技术,可以传入各个归约器的值完成排序。 ​ 二次排序问题解决方案 ​ 归约器值排序至少有2种方案。这些使用hadoop和Spark都可以
相关文章
相关标签/搜索