[hadoop2.7.1]I/O之MapFile(排过序的SequenceFile)读、写、重建index实例

MapFile 是排序后的SequenceFile,MapFile由两部分组成,分别是data和index。 index 文件的数据索引,主要记录了每个Record的key值,以及该Record在文件中的偏移位置。在MapFile被访问的时候,索引文件会被加载到内存,通过索引映射关系可迅速定位到指定Record所在文件位置,因此,相对SequenceFile而言,MapFile的检索效率是高效的,
相关文章
相关标签/搜索