Hive 优化篇干货 整理

Hive 优化 ? Hive SQL本质就是MapReduce 1.任务层:在小数据量的时候我们可以开启本地模式(单台机器可以处理所有的任务。对于小数据集可以明显缩短)、 因为跑MR的话启动时间会花费很长一段时间 (2)hive.fetch.task.conversion设置成 more,然后执行查询语句,如下查询方式都不会执行 mapreduce 程序。 2.存储和压缩层:存储格式和数据压缩(O
相关文章
相关标签/搜索