MapReduce流程浅析

前言 Hadoop是一个实现了Google云计算系统的开源系统,包括并行计算模型Map/Reduce、分布式文件系统HDFS,以及分布式数据库Hbase,同时Hadoop的相关项目也很丰富,包括ZooKeeper、Pig、Chukwa、Hive、Hbase、Mahout、flume等。 这里,我们明确了MapReduce是一个分布式并行编程框架,它将复杂的、运行于大规模集群上的并行计算过程高度地抽
相关文章
相关标签/搜索