Spark SQL简介

Spark SQL是Spark1.0版本中加入的组件,是Spark生态系统中最活跃的组件之一。它能够利用Spark进行结构化数据的存储和操作,结构化数据存储即可来自外部结构化数据源,也可以通过向已有RDD增加Schema的方式得到。 Spark SQL提供了方便的接口调用,用户可以使用Scala、Java、Python语言开发基于Spark SQL API的数据处理程序,并通过SQL语句于Spar
相关文章
相关标签/搜索