hive简单查询优化总结

          hive作为hadoop系列的计算模型,在公司的数据清洗和报表开发广泛使用,合理的优化自己的语句结构可以节省计算时间,优化集群的计算资源,下面总结下日常工作中自己碰到的一些问题和别人总结的一些方法。 优化的策略 我们先了解下关系型数据库sql的执行顺序,hive大致相同 具体策略: 1、尽早的过滤数据,hive同样会先执行join,再执行where,分区表要加分区,同时只选择需
相关文章
相关标签/搜索