Hive的Order by、Sort by、Distribute by和Cluster by的区别

在Hive中,可以像SQL一样对数据进行全局或局部排序,这里利用orders表来测试order by、sorty by、distribute by和cluster by的排序结果。 数据准备 orders表的字段如下:利用order_dow(其取值范围是0-6)字段来测试 orders表的数据如下(limit 20): 在以下测试中我设置reduce数为3,便于观察不同排序的效果 set mapr
相关文章
相关标签/搜索