[使用SparkSQL操做DataFrame]

    SparkSql 是一种处理结构化模型数据的Spark模块,它提供了一种叫作DataFrame抽象编程,它也能够做为分布式Sql查询引擎, SparkSql能够从已经安装的Hive服务中读取数据,也能够从RDBMS 数据库中读取数据。html     在Spark2.0以后,引入了SparkSession新概念。SparkSession实质上是SQLContext和HiveContext的
相关文章
相关标签/搜索