SparkSql入门及简单实例

一 SparkSql简介 Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫作DataFrame而且做为分布式SQL查询引擎的做用。 什么是DataFrames? 与RDD相似,DataFrame也是一个分布式数据容器。然而DataFrame更像传统数据库的二维表格,除了数据之外,还记录数据的结构信息,即schema。同时,与Hive相似,DataFrame也支持嵌
相关文章
相关标签/搜索