跟A君学大数据(三)--利用MapReduce对多文件数据进行排序

时间 2021-01-18

原文原文链接

先来一个小插曲 MapReduce Job中的全局数据在MapReduce中如何保存全局数据呢？可以考虑以下几种方式读写HDFS文件，即将变量存在一个地方配置Job属性，即将变量写道配置（Configuration）中使用DistributedCache，但是DistributedCache是只读的排序首先联想MapReduce过程，先Map，给输入，并给输出。Reduce则是将结果处