大数据MapReduce总结

MapReduce简介 MapReduce定义: Hadoop MapReduce是一个软件框架,基于该框架能够容易地编写应用程序,这些应用程序能够运行在由上千个商用机器组成的大集群上,并以一种可靠的,具有容错能力的方式并行地处理上TB级别的海量数据集。 MapReduce主要思想: 分久必合 MapReduce两个阶段: Map端、Reduce端 MapReduce核心思想:“相同”的key为一
相关文章
相关标签/搜索