Parquet 学习笔记

背景 2010年 google 发表了一篇论文《Dremel: Interactive Analysis of Web-Scale Datasets》,介绍了其 Dermel 系统是如何利用列式存储管理嵌套数据的,嵌套数据就是层次数据,如定义一个班级,班级由同学组成,同学的信息有学号、年龄、身高等。 Parquet 是 Dremel 的开源实现,作为一种列式存储文件格式,2015年称为 Apach
相关文章
相关标签/搜索