WordCount(1)

1.读取文件 需要用到抽象类InputFormat的子类TextInputFormat,把文件每行变成键值对如图,此时k1是距离文本开头的偏移量,v1为每行的内容,该键值对因TextInputFormat而产生,不需要手动书写 2.进入Map ,自定义Map逻辑,将k1 v1转为k2 v2 继承Mapper,重写map方法 3.进入shuffle阶段,此时拿到的数据是上述k2 v2 分区 排序 规
相关文章
相关标签/搜索