mapreduce运行的5个阶段

mapreduce运行的5个阶段 mapreduce在运行的过程当中大体归纳为5个步骤 1. [input阶段]获取输入数据进行分片做为map的输入 2. [map阶段]过程对某种输入格式的一条记录解析成一条或多条记录 3. [shffle阶段]对中间数据的控制,做为reduce的输入 4. [reduce阶段]对相同key的数据进行合并 5. [output阶段]按照格式输出到指定目录node
相关文章
相关标签/搜索