Hadoop-MapReduce粗略理解(一)

本文不做任何商业用途,仅仅用于知识分享。如有侵权行为,请联系我谢谢。 通过阅读书籍查阅相关资料总结得出 本人片面理解: map 相当于数据准备阶段,主要负责从HDFS中读取分块,因为每个分块的大小近乎相等,所以通过集群调度任务将数据采集到map中。实现读取效率最大化 reduce。处理各个节点上map的值(利用网络传输)传输到reduce节点。由reduce 完成 聚合,排序等一系列处理。最终写入
相关文章
相关标签/搜索