Hive面试题考点-整理

1)Hive数据倾斜问题:mysql 倾斜缘由: map输出数据按Key Hash分配到reduce中,因为key分布不均匀、或者业务数据自己的特色。等缘由形成的reduce上的数据量差别过大。sql 1.1)key分布不均匀apache 1.2)业务数据自己的特性数组 1.3)SQL语句形成数据倾斜负载均衡 解决方案:函数 1>参数调节:oop     hive.map.aggr=truecod
相关文章
相关标签/搜索