分布式处理之 MapReduce

时间 2021-01-12

原文原文链接

方法介绍 MapReduce 是一种计算模型，简单的说就是将大批量的工作（数据）分解（map）执行，然后再将结果合并成最终结果（reduce）。这样做的好处是可以在任务被分解后，通过大量机器进行分布式并行计算，减少整个操作的时间。也就是说，MapReduce 的原理就是一个归并排序。它的适用范围为数据量大，但是数据种类小可以放入内存的场景。基本原理及要点是将数据交给不同的机器去处理，数据划分，结

>>阅读原文<<