MapReduce分布式计算框架

    MapReduce是Hadoop系统核心组件之一,是一种可用于大数据并行处理的计算模型、框架和平台,主要解决海量数据的计算,是目前分布式计算模型中应用较为广泛的一种。 MapReduce核心思想:分而治之。 使用MapReduce操作海量数据时: 每个MapReduce程序被初始化为一个工作任务 每个工作任务可以分为Map和Reduce l两个阶段 Map阶段:负责将任务分解,即把负责的任
相关文章
相关标签/搜索