Hadoop MapReduce体系概述

MapReduce是一种并行编程模式,这种模式使得软件开发者可以轻松的编写分布式并行程序。 在Hadoop的体系结构中,MapReduce是一个简单易用的软件框架,基于它可以将任务分配到大量的机器集群上,并提供一种高容错的方式并行处理大量的数据集,实现Hadoop的并行任务处理。 在早期的MapReduce框架中,主要由一个单独运行在主节点的JobTracker进程和运行在每个集群从节点上的Tas
相关文章
相关标签/搜索