Hadoop入门——数据处理

1.map和reduce ​ MapReduce任务编写分为两个阶段:map阶段和reduce阶段,每个阶段都以键值对作为输入和输出。对于NCDC数 据找出每年的最高气温,map阶段输入为原始数据以偏移量为键,每行数据为值,输出每条记录的年份与温度的键值对,如图所示: 图1 map阶段输入数据格式 图2 map阶段输出数据格式 ​ reduce阶段的输入为map阶段的输出,该输出经过处理后将相同键
相关文章
相关标签/搜索