Hadoop学习笔记 --- 文件格式介绍

Hadoop 作为MR 的开源实现,一直以动态运行解析文件格式并获得比MPP数据库快上几倍的装载速度为优势。 不过,MPP数据库社区也一直批评Hadoop由于文件格式并非为特定目的而建,因此序列化和反序列化的成本过高。 Hadoop文件格式简介: (1)Sequence File SequenceFile是Hadoop API 提供的一种二进制文件,它将数据以<key,value>的形式序列化到文
相关文章
相关标签/搜索