Spark指南——第三章:SparkSQL概述(1)

SparkSQL概述(1) 一、SparkSQL概述 二、DataFrame 三、Dataset:类型安全的结构化API 四、DataFrame与 Dataset的比较 一、SparkSQL概述 我们知道Hive,它是将Hive SQL转换成MapReduce然后提交到集群上执行,大大简化了编写MapReduc的程序的复杂性,但是由于Hive基于MapReduce进行处理,在该过程中大量的中间磁盘
相关文章
相关标签/搜索