hadoop(2) MapReduce原理解析

1. 概述 Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架; Mapreduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个hadoop集群上; 1.1 MapReduce的诞生背景 背景原因: (1) 海量数据在单机上处理因为硬件资源限制,无法胜任; (2) 而一旦将单机版程序扩展到集群来
相关文章
相关标签/搜索