HIVE面试题

1 hive表关联查询,如何解决数据倾斜的问题? 倾斜缘由:sql map输出数据按key Hash的分配到reduce中,因为key分布不均匀、业务数据自己的特、建表时考虑不周、等缘由形成的reduce 上的数据量差别过大。数据库 1)、key分布不均匀;数组 2)、业务数据自己的特性;负载均衡 3)、建表时考虑不周;函数 4)、某些SQL语句自己就有数据倾斜;工具 如何避免:对于key为空产生
相关文章
相关标签/搜索