Spark SQL

非结构化数据与结构化数据 Spark SQL是spark用来处理结构化数据的Apache Spark组件 : 与最基本的Spark API——RDD API不同的是Spark SQL接口提供了更多关于数据结构和正在执行的计算的相关信息 在Spark内部,Spark可以使用这些信息来对运算进行额外的优化 Spark SQL的特点 : 1.Spark SQL使用的数据来源 Spark SQL可以使用如
相关文章
相关标签/搜索