hive hql语句高级用法

一,order by ,sort by,distribute by 的用法 1)order by 对全局数据的一个排序,仅仅只有一个reduce工做,最好不用。node 2)sort by  对每个reduce 内部数据进行排序,全局结果集来讲不是排序。  set mapreduce.job.reuces = 3 ;  会生成3个文件,每一个文件内都是排好序的。算法 3)distribute by
相关文章
相关标签/搜索