Hive性能优化

架构层面优化: l  分表node l  合理利用中间结果集,避免查过就丢的资源浪费,减低Hadoop的IO负载sql l  经常使用复杂或低效函数尽可能不用或拆分红其余实现方式,如count(distinct)apache l  合理设计表分区,静态分区和动态分区缓存 l  优化时必定要把握总体,单个做业最优不如整个做业最优。网络 l  文件存储格式和压缩方式session l  Hadoop自
相关文章
相关标签/搜索