Hive 文件格式详解

hive中的 file_format SEQUENCEFILE:生产中绝对不会用,k-v格式,比源文本格式占用磁盘更多 TEXTFILE:生产中用的多,行式存储 RCFILE:生产中用的少,行列混合存储,OCR是他得升级版 ORC:生产中最常用,列式存储 PARQUET:生产中最常用,列式存储 AVRO:生产中几乎不用,不用考虑 JSONFILE:生产中几乎不用,不用考虑 INPUTFORMAT:
相关文章
相关标签/搜索