【Spark篇】---SparkSQL初始和创建DataFrame的几种方式

一、前述       1、SparkSQL介绍           Hive是Shark的前身,Shark是SparkSQL的前身,SparkSQL产生的根本原因是其完全脱离了Hive的限制。 SparkSQL支持查询原生的RDD。 RDD是Spark平台的核心概念,是Spark能够高效的处理大数据的各种场景的基础。 能够在Scala中写SQL语句。支持简单的SQL语法检查,能够在Scala中写H
相关文章
相关标签/搜索