黑猴子的家:MapReduce Map端表合并(Distributedcache)案例二

1、分析 适用于关联表中有小表的情形; 可以将小表分发到所有的map节点,这样,map节点就可以在本地对自己所读到的大表数据进行合并并输出最终结果,可以大大提高合并操作的并发度,加快处理速度。 2、先在驱动模块中添加缓存文件 import java.net.URI; import org.apache.hadoop.conf.Configuration; import org.apache.had
相关文章
相关标签/搜索