hive 中的map join 操作

今天遇到一个Hive的问题,如下hive sql: select f.a,f.b from A t join B f  on ( f.a=t.a and f.ftime=20110802)  该语句中B表有30亿行记录,A表只有100行记录,而且B表中数据倾斜特别严重,有一个key上有15亿行记录,在运行过程中特别的慢,而且在reduece的过程中遇有内存不够而报错。 为了解决用户的这个问题,考虑
相关文章
相关标签/搜索