Hive面试题1

1. hive表关联查询,如何解决数据倾斜的问题?sql   倾斜缘由:数据库 map输出数据按key Hash的分配到reduce中,因为key分布不均匀、业务数据自己的特、建表时考虑不周、等缘由形成的reduce 上的数据量差别过大。数组 1)、key分布不均匀;负载均衡 2)、业务数据自己的特性;函数 3)、建表时考虑不周;工具 4)、某些SQL语句自己就有数据倾斜;oop 如何避免:对于k
相关文章
相关标签/搜索