SparkSQL概述

文章目录 什么是SparkSQL 什么是DataFrame 什么是DataSet RDD,DataFrame和DataSet之间的关系 什么是SparkSQL Spark SQL是Spark用来处理结构化数据的一个模块,它提供了2个编程抽象:DataFrame和DataSet,并且作为分布式SQL查询引擎的作用。Hive是将Hive SQL转换成MapReduce然后提交到集群上执行,大大简化了编
相关文章
相关标签/搜索