Hadoop实战之MapReduce_01

什么是MapReduce MapReduce是一个用于处理海量数据的分布式计算框架,这个框架解决了 数据分布式存储(数据存在HDFS上) 作业调度 机器间通信 容错 MapReduce使用分治方式(分解,求解,合并),通过Map切分,Reduce合并进行数据处理,如图 理解上面这幅图非常重要,普遍情况下,大部分开发人员进行MapReduce开发任务时,只需要关注灰色部分。 运行MapReduce程
相关文章
相关标签/搜索