一种SequenceFile的格式研究

  最近仔细研究了如下公司中使用的SequenceFile文件格式,SequenceFile的格式比较紧凑,实现了从中间读取文件内容(便于hadoop将文件进行适当地切分),同时也能够支持仅读取文件的元数据功能。java   概述 通过总结后的文件格式图大概以下:   其中进入到SequenceFile的全部记录,都须要根据必定的hash规则肯定一个HashKey。相对而言,记录块是比较简单的,每
相关文章
相关标签/搜索