Hive之表优化

1、小表、大表 Join  将 key 相对分散,而且数据量小的表放在 join 的左边,这样能够有效减小内存溢出错误发生的概率;再进一步,可使用 map join 让小的维度表(1000 条如下的记录条数)先进内存。在 map 端完成 reduce。 负载均衡 新版的 hive 已经对小表 JOIN 大表和大表 JOIN 小表进行了优化。小表放在左边和右边已经没有明显区别。 优化 例:ui 一、
相关文章
相关标签/搜索