跟A君学大数据(三)--利用MapReduce对多文件数据进行排序

先来一个小插曲 MapReduce Job中的全局数据 在MapReduce中如何保存全局数据呢?可以考虑以下几种方式 读写HDFS文件,即将变量存在一个地方 配置Job属性,即将变量写道配置(Configuration)中 使用DistributedCache,但是DistributedCache是只读的 排序 首先联想MapReduce过程,先Map,给输入,并给输出。Reduce则是将结果处
相关文章
相关标签/搜索