spark sql加载parquet格式和json格式数据

Parquet存储格式 1. 什么是Parquet数据格式? Parquet是一种列式存储格式,能够被多种查询引擎支持(Hive、Impala、Drill等),而且它是语言和平台无关的。 2. Parquet文件下载后是否能够直接读取和修改呢? Parquet文件是以二进制方式存储的,是不能够直接读取和修改的。Parquet文件是自解析的,文件中包括该文件的数据和元数据。 3. 列式存储和行式存储
相关文章
相关标签/搜索