HDFS随笔——MapReduce

MapReduce 优点:海量数据离线处理&易开发&易运行 缺点:不可能做到实时 流式计算(因为数据拆分是的流式计算不可能实现,多个程序实现以来关系,一个输出是另一个的输入) MapReduce编程模型之Map和Reduce阶段 多个mapping之间是并行处理的,相互支架是没有依赖关系的; 框架会对输出进行排序 mapping的输出作为reducing的输入,作业的输出都是存储在文件系统里面的
相关文章
相关标签/搜索