Hadoop Streaming 实战: 多路输出

streaming把reduce的输出做为一个任务的最终输出,输出文件形如:        part-00000、part-00001……        文件个数为reduce任务个数  可是,有的时候,咱们有多路输出的需求,eg:一部分数据做为下一个mapreduce任务的输入,另外一部分数据直接供下游任务抓取,此时,咱们就须要使用reduce的多路输出。html 在hadoop-v2-u7中,
相关文章
相关标签/搜索