MapJoin和ReduceJoin区别及优化

MapJoin和ReduceJoin区别及优化 1 Map-side Join(Broadcast join) 思想:web 小表复制到各个节点上,并加载到内存中;大表分片,与小表完成链接操做。apache 两份数据中,若是有一份数据比较小,小数据所有加载到内存,按关键字创建索引。大数据文件做为map的输入,对map()函数每一对输入,都可以方便的和已加载到内存的小数据进行链接。把链接结果按key
相关文章
相关标签/搜索