MapReduce的Combiner详解

核心意义 :减少集群之间的网络开销 具体实现步骤 1.自定义一个Combiner 继承 reduce 重写reduce方法 2.在 job 中设置:job.setCombinerClass(Combiner类.class) 注意: combiner 能够应用的前提是不能影响最终的业务逻辑,而且,combiner 的输出 kv 应该跟 reducer 的输入 kv 类型要对应起来 不适用的场景: 求
相关文章
相关标签/搜索