Spark Sql快速入门

注:笔者环境 hdp2.5 + linux + spark1.6.3java 一. Spark SQL简介 Spark SQL是一个用来处理结构化数据的Spark组件。 可被视为一个分布式的SQL查询引擎,而且提供了一个叫作DataFrame的可编程抽象数据模型。 Spark SQL能够直接处理RDD,也能够处理Parquet文件或者JSON文件,甚至能够处理外部数据库(关系型数据库同样支持)中的
相关文章
相关标签/搜索