mapreduce中FileInputFormat与TextInputFormat解析以及HDFS小文件优化

一、FileInputFormat与TextInputFormat 在map阶段,文件先被切分成split块,而后每一个split切片对应一个Mapper任务 FileInputFormat这个类先对输入文件进行逻辑上的划分,以128M为单位,将原始数据从逻辑上分割成若干个split,每个split切片对应一个Mapper任务 TextInputFormat这个类随后将每个split块中的每行记录
相关文章
相关标签/搜索