分布式处理之 MapReduce

方法介绍 MapReduce 是一种计算模型,简单的说就是将大批量的工作(数据)分解(map)执行,然后再将结果合并成最终结果(reduce)。这样做的好处是可以在任务被分解后,通过大量机器进行分布式并行计算,减少整个操作的时间。也就是说,MapReduce 的原理就是一个归并排序。 它的适用范围为数据量大,但是数据种类小可以放入内存的场景。基本原理及要点是将数据交给不同的机器去处理,数据划分,结
相关文章
相关标签/搜索