spark2.0新特性--执行计划

spark2.0出现了Dataset,一个更加智能的RDD(本质上还是RDD)。 这个Dataset操作更加 1.简单:支持标准SQL和简化的API 2.执行速度更快:spark作为一个编译器 3.也更加智能:Dataset结构化数据流 但是这个Dataset究竟怎么智能了呢? Dataset相比RDD改进的一个重要的地方就是这个Dataset执行的时候会先生成执行计划。 那为什么生成执行计划就可
相关文章
相关标签/搜索