hadoop文件格式

按行存储:sequenceFile、mapfile、avro sequenceFile:hadoop api提供的一种二进制文件,数据以<key,value>的形式序列化到文件中。不是很常用,一般用来合并小文件。 mapfile:带索引的sequenceFile avro:数据序列化框架,类似protocol buffers,thrift,avro有自己的文件格式.avro结尾,avro依赖she
相关文章
相关标签/搜索