hive原理及执行任务流程优化

Hive架构 Hive主要有QL,MetaStore和Serde三大核心组件构成。 QL:是编译器也是Hive中最核心的部分。 Driver模块的工作是将HQL语句转化为MapReduce调用. 包括主要的三个阶段: 编译:Compile,生成执行计划 优化:Optimize,优化执行计划(当前的Hive实现是在执行前做一次唯一的优化,没有反馈的过程,这使得优化工作只能是rule-based,做不
相关文章
相关标签/搜索