Spark(19) -- Spark SQL -- 概述

1. 什么是Spark SQL  Spark SQL是Apache Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。  相比于Spark RDD API,Spark SQL包含了对结构化数据和在其上运算的更多信息,Spark SQL使用这些信息进行了额外的优化,使对结构化数据的操作更加高效和方便。  有多种方式去使用Spark
相关文章
相关标签/搜索