hadoop主要类介绍-开始篇

HADOOP类 (1)  InputFormat:将输入的数据分割成split,并将split拆分红<k,v>做为map输入。Job.setInputFormatClass()设置,TextInputFormat将文本按行分割成split,LineRecorderReader将每行解析为<k,v>node (2)  Mapper:实现map函数,将输入的<k,v>生成中间结果,经过job.setM
相关文章
相关标签/搜索