【大数据】Spark SQL的相关总结【重点笔记!!!】

1. Spark SQL的介绍 Spark SQL是Spark处理数据的一个模块,跟基本的Spark RDD的API不同,Spark SQL中提供的接口将会提供给Spark更多关于结构化数据和计算的信息。其本质是,Spark SQL使用这些额外的信息去执行额外的优化。 Shark是Spark SQL的前身,是一种分布式SQL查询工具,它的设计目标就是兼容Hive。 Hive、Shark体系结构图:
相关文章
相关标签/搜索