hive性能优化使用map join

在实际业务逻辑中经常进行两张表的join,不管是两张大表关联还是一张大表一张小表关联会出现经常数据倾斜。下面介绍一下我在工作使用的总结: 原始数据page_test 原始数据city 1.Common join原理(select a.user_id,a.city,b.name from page_test a left outer join city b ) 注意: 1.map端的操作key为两张
相关文章
相关标签/搜索