大数据之MapReduce(一)

MapReduce概述与特新 介绍 一个分布式运算的编程框架,是用户开发基于Hadoop的数据分析应用的核心框架 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上 优点:易于编程、良好的扩展性、高容错性、适合PB级以上海量数据的离线处理 缺点:不擅长实时计算、不擅长流式计算(输入数据是动态的)、不擅长DAG(有向图)计算(多个应用程序
相关文章
相关标签/搜索