lucene檔案結構

2021-08-31 16:56:46 字數 731 閱讀 9416

1.索引塊檔案

這個檔案包含了索引中的索引塊資訊,這個檔案包含了每個索引塊的名字以及大小等資訊。表 2 顯示了這個檔案的結構資訊。

表2:索引塊檔案結構

表2:索引塊檔案結構

2.域資訊檔案

我們知道,索引中的文件由乙個或者多個域組成,這個檔案包含了每個索引塊中的域的資訊。表 3 顯示了這個檔案的結構。

表3:域資訊檔案結構

表3:域資訊檔案結構

3.索引項資訊檔案

這是索引檔案裡面最核心的乙個檔案,它儲存了所有的索引項的值以及相關資訊,並且以索引項來排序。表 4 顯示了這個檔案的結構。

表4:索引項資訊檔案結構

表4:索引項資訊檔案結構

4.頻率檔案

這個檔案包含了包含索引項的文件的列表,以及索引項在每個文件中出現的頻率資訊。如果lucene在索引項資訊檔案中發現有索引項和搜尋詞相匹配。那麼 lucene 就會在頻率檔案中找有哪些檔案包含了該索引項。表5顯示了這個檔案的乙個大致的結構,並沒有包含這個檔案的所有字段。

表5:頻率檔案的結構

表5:頻率檔案的結構

5.位置檔案

這個檔案包含了索引項在每個文件中出現的位置資訊,你可以利用這些資訊來參與對索引結果的排序。表 6 顯示了這個檔案的結構

表6:位置檔案的結構

表6:位置檔案的結構

到目前為止我們介紹了 lucene 中的主要的索引檔案結構,希望能對你理解 lucene 的物理的儲存結構有所幫助。

搜尋系統18 lucene索引檔案結構

1.多檔案索引與復合索引的區別 2.segments 段 檔案 3.段元資料 si 儲存了索引段的元資料資訊 4.fnm 網域名稱 檔案 相當於solr裡的schemal.xml檔案 5.項詞典 tis tii 檔案 lucene老版本的項詞典是tis檔案,新版本是tim檔案,如圖 我沒在這個檔案裡...

Lucene索引檔案

如何產生乙個segment?當indexwriter執行commit時,會產生乙個segment。下述檔案每個segment乙個 fnm 儲存乙個segment中field個數,field名稱,field的屬性 是否索引 儲存etc fdt 儲存乙個segment中,每個document中所有fie...

Lucene 6 0 索引結構

該模式是預設的。圖 1 1 復合檔案索引 indexwriterconfig org.apache.lucene.index.indexwriterconfig.setusecompoundfile boolean usecompoundfile 呼叫此函式可以設為多檔案索引模式。圖2 1 多檔案索...