Spark SQL 我的总结

Spark SQL 是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫作DataFrame,而且做为分布式SQL查询引擎的做用java 什么是DataFrames?? 与RDD相似,DataFrames也是一个分布式数据容器;然而DataFrame更像传统数据库的二维表格,除了数据之外,还记录数据的结构信息,即schema; 同时与Hive相似,DataFrame也支持嵌套数据类型(
相关文章
相关标签/搜索