Hive性能优化

1.概述   Hive优化介绍,转:http://www.cnblogs.com/smartloli/p/4356660.html 2.介绍   首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题? 数据量大不是问题,数据倾斜是个问题。 jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,耗时很长。原因是map reduce作
相关文章
相关标签/搜索