MapReduce原理分析:自定义输出格式OutputFormat

1. 输出格式OutputFormat 在MapReduce框架中,OutputFormat负责把Reducer处理完成的Key-Value写出到本地磁盘或HDFS上,默认计算结果会以part-000的命名输出成多个文件,并且输出的文件数量与Reduce数量一致。000是关联到某个Reduce任务的分区的Id号。关于分区号id号如何确定,请查看: MapReduce原理分析:自定义分区Partit
相关文章
相关标签/搜索