Spark-SQL编程总结

概览 Spark SQL用于处理结构化数据,与Spark RDD API不一样,它提供更多关于数据结构信息和计算任务运行信息的接口,Spark SQL内部使用这些额外的信息完成特殊优化。能够经过SQL、DataFrames API、Datasets API与Spark SQL进行交互,不管使用何种方式,SparkSQL使用统一的执行引擎记性处理。用户能够根据本身喜爱,在不一样API中选择合适的进行
相关文章
相关标签/搜索