spark sql之读写数据(十二)

简介   Spark SQL支持多种结构化数据源,轻松从各类数据源中读取Row对象。这些数据源包括Parquet、JSON、Hive表及关系型数据库等。java   当只使用一部分字段时,Spark SQL能够智能地只扫描这些字段,而不会像hadoopFile方法同样简单粗暴地扫描所有数据。python Parquet   Parquet是一种流行的列式存储格式,能够高效地存储具备嵌套字段的记录。
相关文章
相关标签/搜索