大数据技术Hive中parquet和SEQUENCEFILE区别 (第一篇)

概述 目录 概述 1. hive文件存储格式包括以下几类: 一、TEXTFILE 二、SEQUENCEFILE 三、RCFile文件格式 概述历史 RCFile使用 基于行存储的优点和缺点 基于列存储的优点和缺点 源码分析 1. Writer 2. append RCFile的索引机制 flushRecords的具体逻辑 RCFile的Sync机制 RCFileclose过程 数据读取和Lazy解
相关文章
相关标签/搜索