Spark2.x学习笔记:1四、Spark SQL程序设计

Spark2.x学习笔记:1四、 Spark SQL程序设计 14.1 RDD的局限性 RDD仅表示数据集,RDD没有元数据,也就是说没有字段语义定义。 RDD须要用户本身优化程序,对程序员要求较高。 从不一样数据源读取数据相对困难。 合并多个数据源中的数据也较困难。 14.2 DataFrame和Dataset (1)DataFrame 因为RDD的局限性,Spark产生了DataFrame。
相关文章
相关标签/搜索