分布式计算框架MapReduce

编程模型之核心概念 Split InputFormat OutputFormat Combiner:map端的聚合操作 Partitoner 编程模型之执行步骤 准备map处理的输入数据 Mapper处理 Shuffle Reduce处理 结果输出 通过 InputFormat 读入HDFS上的文件 通过 Split 进行分片后,用 RecordReader 读取进来 input(k,v) pai
相关文章
相关标签/搜索