Lucene索引檔案

2021-08-31 22:08:38 字數 540 閱讀 4643

如何產生乙個segment?

當indexwriter執行commit時,會產生乙個segment。

下述檔案每個segment乙個:

.fnm:儲存乙個segment中field個數,field名稱,field的屬性(是否索引、儲存etc)

.fdt:儲存乙個segment中,每個document中所有field的域號、field屬性(是否分詞、是否二進位制、是否壓縮etc),field中儲存的值

.fdx:儲存乙個segment中,每個document在.fdt中的偏移

.tvx, .tvd, .tvf儲存了從index->document->filed->term的正向資訊。

.tvf:儲存乙個segment中的所有field,對每個field,儲存了field中的所有term資訊,包含term的文字、頻率、位置、偏移量資訊

.tvd:儲存了乙個segment中的每個document的所有域在.tvf中的偏移量

.tvx:儲存了乙個segment中document在.tvd中的偏移量以及第乙個field在.tvf中的偏移量

Lucene系列 索引檔案

本文介紹下lucene生成的索引有哪些檔案組成,每個檔案包含了什麼資訊。基於lucene 4.10.0。索引 index 包含了儲存的文件 document 正排 倒排資訊,用於文字搜尋。索引又分為多個段 segments 每個新新增的doc都會存到乙個新segment中,不同的segments又會...

lucene 索引檔案格式

lucene索引檔案格式詳解本文介紹lucene中segment,fnm,fdx,fdt,tii,tis,deletable cfs等格式檔案的用途。1。索引的segment 每個segment代表lucene的乙個完整索引段。通常,在乙個索引中,會包含有多個segment。每個segment都有乙...

lucene 索引檔案格式

下圖是乙個典型的lucene4.x的索引結構圖 lucene4.x之後的所有索引格式如下所示 檔名字尾描述 segments file segments.gen,segments n 儲存段檔案的提交點資訊 lock file write.lock 檔案鎖,保證任何時刻只有乙個執行緒可以寫入索引 s...