Hadoop MultiOutputs 实现

工做中有人问 MultiOutputs 实现为啥在指定reduce数为1时  结果文件数依然是 好多个?这其实由其实现逻辑决定的。java 在MR中 通常job均可以经过map reduce 默认的OutputCollector 实现 写入做业初始化时指定格式的输出中,只能一个文件格式。当须要将结果分门别类区分或者使用不一样格式存储在多个文件结果中时 就须要 MultiOutputs了。git M
相关文章
相关标签/搜索