MapReduce十步执行流程 (详细介绍)

第一步:InputFormat InputFormat 在HDFS文件系统中读取要进行计算的数据 输出给Split 第二步:Split Split 将数据进行逻辑切分,切分成多个任务。 输出给RR 第三步:RR RR 将切分后的数据转换成key value进行输出 key : 每一行行首字母的偏移量 value: 每一行数据 输出给Map 第四步:Map 接收一条一条的数据(有多少行数据Map运行
相关文章
相关标签/搜索