参考资料:html
1. "MapReduce: Simplified Data Processing on Large Clusters" by Den & Ghemawat, 2004git
2. 上边论文的中文版:http://www.cnblogs.com/fuzhe1989/p/3413457.html程序员
3. C++ MapReduce库github
5. 用通俗易懂的话说下hadoop是什么,能作什么分布式
知识点:oop
● MapReduce是一种编程模型,是关于处理和产生大数据集的一种实现。Map(映射)方法用来处理键/值对,并生成中间键/值对集。Reduce(归约)方法整合全部拥有相同中间键的中间值。按照这种方式写出的程序会自动并行,运行在一个大的商业计算机集群上。运行时系统负责具体的输入数据的划分、在大集群中的计算机上的程序的执行调度、计算机运行失败的处理以及对所中间计算机通讯进行管理。所以,这不要求程序员拥有并行和分布式系统的经验,就能容易地使用一个大的分布式系统中的资源。大数据