Spark 官方文档(5)——Spark SQL,DataFrames和Datasets 指南

Spark版本:1.6.2 html 概览 Spark SQL用于处理结构化数据,与Spark RDD API不一样,它提供更多关于数据结构信息和计算任务运行信息的接口,Spark SQL内部使用这些额外的信息完成特殊优化。能够经过SQL、DataFrames API、Datasets API与Spark SQL进行交互,不管使用何种方式,SparkSQL使用统一的执行引擎记性处理。用户能够根据本
相关文章
相关标签/搜索