MapReduce之mapper任务执行流程详解

        第一阶段是把输入目录下文件按照必定的标准逐个进行逻辑切片,造成切片规划。默认状况下,Split size = Block size。每个切片由一个MapTask 处理。(getSplits) 第二阶段是对切片中的数据按照必定的规则解析成<key,value>对。默认规则是把每一行文本内容解析成键值对。key 是每一行的起始位置(单位是字节),value 是本行的文本内容。(Text
相关文章
相关标签/搜索