hive mapjoin使用

今天遇到一个hive的问题,以下hive sql: sql select f.a,f.b from A t join B f  on ( f.a=t.a and f.ftime=20110802)  spa 该语句中B表有30亿行记录,A表只有100行记录,并且B表中数据倾斜特别严重,有一个key上有15亿行记录,在运行过程当中特别的慢,并且在reduece的过程当中遇有内存不够而报错。orm 为
相关文章
相关标签/搜索