hive中order by,sort by, distribute by, cluster by做用以及用法

1. order by     Hive中的order by跟传统的sql语言中的order by做用是同样的,会对查询的结果作一次全局排序,因此说,只有hive的sql中制定了order by全部的数据都会到同一个reducer进行处理(无论有多少map,也无论文件有多少的block只会启动一个reducer)。可是对于大量数据这将会消耗很长的时间去执行。     这里跟传统的sql还有一点区别
相关文章
相关标签/搜索