大数据生态体系结构

Hadoop 的四大组件:common、HDFS、MapReduce、YARN MapReduce: 基于 YARN 的大型数据集并行处理系统。是一种计算模型,用以进行大数据量的计算。Hadoop 的 MapReduce 实现,和 Common、HDFS 一起,构成了 Hadoop 发展初期的三个组件。MapReduce 将应用划分为 Map 和 Reduce 两个步骤,其中 Map 对数据集上的
相关文章
相关标签/搜索