MapReduce计算任务的步骤

第一步:inputformat inputformat 到HDFS上读取数据 将数据传给split 第二步:split split将数据进行逻辑切分, 将数据传给RR 第三步:RR RR:将传入的数据转换成一行一行的数据,输出行首字母偏移量和偏移量对应的数据 将数据传给MAP 第四步:MAP MAP:根据业务需求实现自定义代码 将数据传给shuffle的partition 第五步:partitio
相关文章
相关标签/搜索