parquet文件格式解析

参考资料: https://parquet.apache.org/documentation/latest/ https://www.jianshu.com/p/47b39ae336d5 前言 Apache Parquet是Hadoop生态系统中任何项目均可使用的列式存储格式,由于OLAP场景下的数据大部分情况下都是批量导入,基本上不需要支持单条记录的增删改操作,而查询的时候大多数都是只使用部分列
相关文章
相关标签/搜索