hive压缩格式

Hive压缩格式 TextFile Hive数据表的默认格式,存储方式:行存储。 可使用Gzip,Bzip2等压缩算法压缩,压缩后的文件不支持split 但在反序列化过程中,必须逐个字符判断是不是分隔符和行结束符,因此反序列化开销会比SequenceFile高几十倍。 --创建数据表: create table if not exists textfile_table( site string,
相关文章
相关标签/搜索