MapReduce --全排序

MapReduce全排序的方法1:   每个map任务对自己的输入数据进行排序,但是无法做到全局排序,需要将数据传递到reduce,然后通过reduce进行一次总的排序,但是这样做的要求是只能有一个reduce任务来完成。   并行程度不高,无法发挥分布式计算的特点。   MapReduce全排序的方法2:   针对方法1的问题,现在介绍方法2来进行改进;   使用多个partition对map的
相关文章
相关标签/搜索