基于HDFS的MapReduce计算框架

          学习MapReduce的原理(http://www.javashuo.com/article/p-cbouujfz-pw.html)之后,我们来看看MapReduce是如何在HDFS集群上实现的。分布式计算框架的思想一般都是计算找数据,这样能减少数据传输中的网络IO开销,可以将一个计算线程比作一个伐木工人,数据就是山上的树木,工人工作肯定是携带工具上山伐木的,而不能把山
相关文章
相关标签/搜索