lucene索引文件格式解析

文件名称 文件后缀名 解析 说明
Segments File

segments.gen编码

segments_Nspa

存储段文件的提交点信息  
Lock File write.lock 文件锁,保证任什么时候刻只有一个线程能够写入索引  
Segment Info .si 存储每一个段文件的元数据信息  
Compound File .cfs, .cfe 复合索引的文件,在系统上虚拟的一个文件,用于频繁的文件句柄  
Fields .fnm 存储域文件的信息  
Field Index .fdx 存储域数据的指针  
Field Data .fdt 存储全部文档的字段信息  
Term Dictionary .tim term字典,存储term信息  
Term Index .tip term字典的索引文件  
Frequencies .frq 词频文件,包含文档列表以及每个term和其词频  
Positions .prx 位置信息,存储每一个term,在索引中的准确位置  
Norms .nrm.cfs, .nrm.cfe 存储文档和域的编码长度以及加权因子  
Per-Document Values .dv.cfs, .dv.cfe 编码除外的额外的打分因素  
Term Vector Index .tvx term向量索引,存储term在文档中的偏移距离  
Term Vector Documents .tvd 包含每一个文档向量的信息  
Term Vector Fields .tvf 存储filed级别的向量信息  
Deleted Documents .del 存储索引删除文件的信息
相关文章
相关标签/搜索