【Hadoop环境搭建】九.分布式离线计算框架---MapReduce

Hadoop中有两个重要的组件:一个是HDFS,另外一个是MapReduce,HDFS主要用来存储大批量的数据,而MapReduce则是经过计算来发现数据中有价值的内容。 本章咱们主要介绍MapReduce中的如下几方面内容:java MapReduce的应用场景、工做机制和编程模型 MapReduce的执行原理 WordCount本地测试实例 9.1 安装Linux版本的eclipse 9.1.
相关文章
相关标签/搜索