Spark SQL 简介

是什么? image Spark 1.0 推出 Spark SQL,是 Spark 生态系统中最活跃的组件之一。能够利用 Spark 进行结构化的存储和操作。结构化数据可以来自外部源:Hive/Json/parquet,1.2开始支持 JDBC等,也可以对已有 RDD 增加 Schema 的方式获得。 当前 Spark SQL 使用 Catalyst 优化器对 SQL 语句进行优化,从而得到更好的
相关文章
相关标签/搜索