SparkSQL基础

SparkSQL概述 SparkSQL是Spark的结构化数据处理模块。特色以下:html 数据兼容:可从Hive表、外部数据库(JDBC)、RDD、Parquet 文件、JSON 文件获取数据; 组件扩展:SQL 语法解析器、分析器、优化器都可从新定义; 性能优化:内存列存储、动态字节码生成等优化技术,内存缓存数据; 多语言支持:Scala、Java、Python; Shark即Hive on
相关文章
相关标签/搜索