Hadoop MultiOutputs 实现

时间 2019-12-06

原文原文链接

工做中有人问 MultiOutputs 实现为啥在指定reduce数为1时结果文件数依然是好多个？这其实由其实现逻辑决定的。java 在MR中通常job均可以经过map reduce 默认的OutputCollector 实现写入做业初始化时指定格式的输出中，只能一个文件格式。当须要将结果分门别类区分或者使用不一样格式存储在多个文件结果中时就须要 MultiOutputs了。git M