SparkSQL基础应用(1.3.1)

一.概述 从1.3版本开始Spark SQL不再是测试版本,之前使用的SchemaRDD重命名为DataFrame,统一了Java和ScalaAPI。 SparkSQL是Spark框架中处理结构化数据的部分,提供了一种DataFrames的概念,同时允许在Spark中执行以SQL,HiveQL或Scala表示的关系型查询语句。 就易用性而言,对比传统的MapReduceAPI,说Spark的RDD
相关文章
相关标签/搜索