Hive与hadoop的面试知识点

一.hive中sort by、order by、distribute by、Cluster by表明什么意思? 一、order by 会对输入作全局排序,所以只有一个 reducer,会致使当输入规模较大时, 须要较长的计算时间。 二、sort by 不是全局排序,其在数据进入 reducer 前完成排序。所以,若是用 sort by 进行排序,而且设置 mapred.reduce.tasks>1
相关文章
相关标签/搜索