黑猴子的家：MapReduce Map端表合并（Distributedcache）案例二

时间 2021-07-12

原文原文链接

1、分析适用于关联表中有小表的情形；可以将小表分发到所有的map节点，这样，map节点就可以在本地对自己所读到的大表数据进行合并并输出最终结果，可以大大提高合并操作的并发度，加快处理速度。 2、先在驱动模块中添加缓存文件 import java.net.URI; import org.apache.hadoop.conf.Configuration; import org.apache.had