MapReduce原理及编程

Hadoop架构 HDFS——分布式文件系统 MapReduce——分布式计算框架 YARN——分布式资源管理系统 Common MapReduce 什么是MapReduce MapReduce是一个分布式计算框架 它将大型数据操作作业分解为可以跨服务器集群并行执行的单个任务 适用于大规模数据处理场景 每个节点处理存储在该节点的数据 每个job包含Map和Reduce两部分 MapReduce的设
相关文章
相关标签/搜索