菜鸟先飞之Hadoop数据模型

一、Hadoop常用数据模型(文件存储格式) 1、Text:文本文件通常采用CSV、JSON等固度长度的纯文本格式 优点: (1)便于与其他应用程序(生成或读取分隔文件)或脚本进行数据交换 (2)易读性好,便于理解 缺点: (1)数据存储量非常庞大 (2)查询效率不高 (3)不支持块压缩 2、SequenceFile: (1)SequenceFile按行存储二进制键值对数据,HDFS自带    
相关文章
相关标签/搜索