分布式计算框架Mapreduce

概念:     Mapreduce是一种编程模型,编程方法,采用“分而自治”思想 优点:海量数据离线处理,易开发,易运行。 缺点:实时流式计算 MapReduce编程模型之执行步骤:    输入一个大文件,通过Split之后,将其分为多个片    每个文件分片由单独的机器去处理,这就是map方法    将各个机器计算的结果进行汇总并得到最终的结果,这就是reduce方法 MapReduce的四个阶
相关文章
相关标签/搜索