浅谈MapReduce的原理及编程

什么是MapReduce MapReduce是一个分布式计算框架; 它将大型数据操作作业分解为可以跨服务器集群并行执行的单个任务;适用于大规模数据处理场景;每个节点处理存储在该节点的数据;每个 job 包含Map和Reduce两部分 MapReduce的设计思想 1、分而治之 简化并行计算的编程模型 2、构建抽象模型 开发人员专注于实现 Mapper 和 Reduce 函数 3、隐藏系统层细节 开
相关文章
相关标签/搜索