MapReduce基本原理与WordCount程序

MapReduce原理   经过简单的Mapper和Reducer的抽象提供一个编程模型,能够在一个由几十台上百台PC组成的不可靠集群上并发地,分布式处理大量的数据集,而把并发、分布式(机器间通讯)和故障恢复等计算细节隐藏起来。 而Mapper和Reducer的抽象,又是各类各样的复杂数据处理均可以分解为的基本元素。这样,复杂的数据处理能够分为多个Job(包含一个Mapper和一个Reducer)
相关文章
相关标签/搜索