最全的SparkSql核心技术分享

1、SparkSQL概述 一、概念 官网:http://spark.apache.org/sql/ Spark SQK是Spark用来处理结构化数据(结构化数据能够来自外部结构化数据源也能够经过RDD获取)的一个模块java 外部的结构化数据源包括 Json,parquet(默认),rmdbs,hive等sql 二、Spark SQL的优势 mapreduce hive(sql框架)减小代码编写s
相关文章
相关标签/搜索