RDD、DataFrame、DateSet基本操作

​一,RDD,DataFrame和DataSet DataFrame参照了Pandas的思想,在RDD基础上增加了schma,能够获取列名信息。 DataSet在DataFrame基础上进一步增加了数据类型信息,可以在编译时发现类型错误。 DataFrame可以看成DataSet[Row],两者的API接口完全相同。 DataFrame和DataSet都支持SQL交互式查询,可以和 Hive无缝衔
相关文章
相关标签/搜索