Spark SQL解析过程

黄色的是数据结构,蓝色的spark的模块,绿色的是hive matestore 。 SQL和DataFrame 进来会先解析成逻辑执行计划,从hive metasotre里面拿一些表、字段的元数据信息,生成一个解析过的执行计划。经过spark的优化器,改变逻辑执行计划的逻辑结构,通过planner生成物理的执行计划。 将sql转换成抽象语法书(逻辑执行计划) 右边的含义:relation就是一个表
相关文章
相关标签/搜索