Hadoop核心MapReduce运行原理与架构剖析

时间 2021-01-01

标签 MapReduce Hadoop 大数据 HDFS 栏目 Hadoop 繁體版

原文原文链接

MapReduce是一种编程模型，用于大规模数据集(大于1TB)的并行运算。MapReduce采用”分而治之”的思想，把对大规模数据集的操作，分发给一个主节点管理下的各个分节点共同完成，然后通过整合各个节点的中间结果，得到最终结果。我整理了一份大数据开发的学习资料（Hadoop，spark，kafka，MapReduce，Flink，scala，推荐算法，实时交易监控系统，用户分析行为，推荐系

>>阅读原文<<