hive学习-问题解答三

1.order by,sort by,distribute by,cluster by的区别? 答: (1)order by: order by会对所给的全部数据进行全局排序,并且,不管有多少数据,都只启动一个reducer来处理。 注意:如果指定了hive.mapred.mode=strict(默认值是nonstrict),这时就必须指定limit来限制输出条数,原因是:所有的数据都会在同一个r
相关文章
相关标签/搜索