Lucene學習筆記2 建立和資料庫對應的索引

2021-08-30 14:13:38 字數 851 閱讀 5996

比如將資料的資料生成索引檔案,查詢出來的資料以list返回,則

1、定義分詞器,lucene自帶的分詞器為標準分詞器,standardanalyzer,

但我們這裡要講的是中文分詞器--ik_canalyzer ikanalyzer = new ik_canalyzer();

/* 建立索引初始化,執行這些語句將建立或清空c:\\index\\目錄下所有索引 */

file file = new file(path);

if (file.isdirectory())

//中文分詞器

ik_canalyzer ikanalyzer = new ik_canalyzer();

indexwriter writer1 = new indexwriter(path, ikanalyzer, true);

writer1.close();

indexwriter writer2 = new indexwriter(path, ikanalyzer, false);

//這裡的false表示在新建索引檔案時要刪除舊的索引檔案,true表在舊的索引檔案中追加新的索引記錄

for (int i = 0; i < list.size(); i++)

說明:/*

* 建立乙個域articletitle,並往這個域裡面新增內容 "field.store.yes"表示域裡面的內容將被儲存到索引

* "field.index.tokenized"表示域裡面的內容將被索引,以便用來搜尋 lucene給文件的字段設定三個布林變數:

* 索引(indexed), 儲存(stored), 切詞(tokenized) ,

*/

lucene學習筆記2

簡介 doug cutting 於2000年開始的專案 2001年9月後加入apache,lucene是doug cutting的middle name 目前lucene已經是apache的top level的專案,已經不在jakarta下面,同時也有了python,perl,c net,ruby ...

lucene學習筆記2 檢索

對已經建立好的索引庫進行檢索 功能詳細描述 param keyword 搜尋條件 param indexpath 索引路徑 throws ioexception throws parseexception see 類 類 方法 類 成員 public void search string keywo...

Lucene 學習筆記

調整索引索引效能 在乙個典型的索引應用中,程式效能的瓶頸存在於將索引檔案寫入磁碟的過程中。如果你曾經分析過索引過索引應用程式,應該會發現執行程式大部分時間都消耗在操作索引檔案的程式段上,因此我們必要使lucene索引新物件和修改索引檔案時變得更智慧型。當新的document物件新增到lucene的索...