lucene實時建立索引 注意事項

2021-05-22 11:49:30 字數 392 閱讀 1400

實時建立索引一直是我思考的問題,雖然現在這個問題還沒有圓滿解決,但是我總結出了一些注意事項,現在先記錄下來!

第一,確保indexwriter只有乙個,建議做乙個靜態的indexwriter,只有乙個路徑去開啟和關閉!

第二,確保只有一條執行緒去建立索引,因為lucene的索引檔案帶有自定義的鎖檔案,如果有多條執行緒去修改索引會出現異常!

第三,確保定時去優化索引檔案,建議晚上2點到4點去優化,在優化的時候是不能建立索引的,但是2點到4點的訪問量應該是較低的,所以應該是沒有問題的。如果不優化索引,等到索引庫很龐大之後優化的時間就會更長,需要的空間和記憶體更多。

第四,確保可以關閉indexwriter,否則下次將無法開啟索引檔案,ps:雖然可以通過刪除*.lock檔案重新開啟,但是不保證索引檔案是否已經損壞了。

Lucene 建立索引

public class indexer public static string indexdir d luceneindex public static void main string args system.out.println 被索引的文件個數 writer.numdocs catch ...

Lucene之建立索引

lucene用來建搜尋引擎要解決四個問題 抓取資料 解析資料 建立索引和執行搜尋。首先為每一篇文章新增標題 內容 寫作時間等資訊,從而寫好每一篇文章,然後將每一篇文章新增到書裡面去。這樣問及就寫好了。建立索引的過程如下 建立索引器indexwriter,這相當於一本書的框架。建立文件物件docmen...

如何建立Lucene索引

需要用到的ipa indexwriter 這個是索引建立的中心元件,通過他就可以建立索引,它是生成索引的過程 與讀取和搜尋索引沒有關係 初始化化它時,需要傳遞的兩個引數。第乙個是引數是指定索引建立的位置,第二是引數是配置分詞器。document 這個文字相當於資料庫中的一條記錄,它裡面需要新增fie...