hive优化总结

优化时,把hive sql当作map reduce程序来读,会有意想不到的惊喜。算法 理解hadoop的核心能力,是hive优化的根本。这是这一年来,项目组全部成员宝贵的经验总结。sql   长期观察hadoop处理数据的过程,有几个显著的特征:cookie 1.不怕数据多,就怕数据倾斜。网络 2.对jobs数比较多的做业运行效率相对比较低,好比即便有几百行的表,若是屡次关联屡次汇总,产生十几个j
相关文章
相关标签/搜索