Spark Dataset介绍和使用

        Dataset是从Spark 1.6开始引入的一个新的抽象,当时仍是处于alpha版本;然而在Spark 2.0,它已经变成了稳定版了。下面是DataSet的官方定义:java         Dataset是特定域对象中的强类型集合,它能够使用函数或者相关操做并行地进行转换等操做。每一个Dataset都有一个称为DataFrame的非类型化的视图,这个视图是行的数据集。上面的定义
相关文章
相关标签/搜索