大数据调优

1.distrbute by rand()或者加表中字段 算法

           distribute by是控制在map端如何拆分数据给reduce端的。hive会根据distribute by后面列,对应reduce的个数进行分发,默认是采用hash算法hash

相关文章
相关标签/搜索