必看的Spark SQL入门教程

    Spark SQL 是 Spark 的一个结构化数据处理模块,提供了一个 DataFrame 的抽象模型,在 Spark 1.6.0之后,又加入了 DataSet 的抽象模型,因此它是一个分布式 SQL 查询引擎,Spark SQL 主要由 Catalyst 优化,Spark SQL 内核,Hive 支持三部分组成。         Spark SQL的架构是什么样的? 如上所示,虽然有点
相关文章
相关标签/搜索