LUCENE 讀書筆記 20070712

2021-04-13 04:17:45 字數 990 閱讀 3784

20070712

檢索:建立了索引就是為了檢索用的,下面就開始看嘍。

檢索的步驟:

1 建立indexsearcher

初始化indexsearcher的方法有很多種,最簡單的就是傳遞乙個索引檔案所在目錄的字串作為引數。

2 構建query

query代表了查詢的條件以及查詢的一些引數

3 返回查詢結果並進行處理

建立indexsearcher ,其實就是告訴lucene我要在**查詢。書上一共列出了4種構造方式,現在對是否在關閉indexsearcher時關閉indexreader有點不清楚是什麼意思。

建立query ,其實就是告訴lucene我要根據那些字段,以什麼樣的規則進行查詢。

兩者一結合,哈哈,就是查詢結果了。

查詢結果是用hits物件表示的。hits中就是代表查詢到的資料,裡面是是什麼,是document物件阿。這樣,你存進去的東西就能被取出來了。

這就是大體的查詢過程了,簡單不?其實複雜的在後面那。

書上說的一點以前沒注意到:關閉indexsearcher的時候(呼叫close)的時候其實施關閉的它使用的indexreader。就是說,indexsearcher使用了indexreader進行資料查詢。

書上接著講的是hits,我感覺該先詳細將query才對啊,不管了,它講啥咱看啥吧。

hits:

hits是將所有的匹配結果一次性全部查詢出來,這對效能是很不好的,書上說給出了一種lazy的例子,好像下面就是哦。

暈那,這個例子好像不是,白高興一場…………。希望下面有吧。

lucene的評分機制:

概念:評分機制,簡單的說就是根據一定的規則(比如說:檢索字段出現的頻率),在查詢的時候作為決定查詢結果現實順序的標準。

具體怎麼計算的俺不管,俺沒那個本事去修改規則。

但我們還是可以控制一部分顯示級別的:

那就是在建立document的時候用setboost(float),這個引數月大應該越容易被查詢到,值不大於1。

LUCENE讀書筆記 20070702

2007 7 2 突然想學lucene了,不知為什麼,就是想學了,為了防止半途而廢,決定寫讀書筆記,大家監督。初學者寫的,切記不可當教程看,不准的。本不想發在blog,但實在沒時間整別的了,還是發了吧 lucene 是什麼?lucence 是一種全文檢索工具,它按照一定的規則去建立檔案索引,然後再按...

LUCENE 讀書筆記 20070704

2007 7 4 建立索引 前面已經建立了document和field,那麼如何儲存建立好的索引呢?這是通過indexwriter實現的。indexwriter在建立的時候需要指定索引檔案所在目錄引數 分析器引數 用來在進行索引的時候對文字進行分析,用來進行將索引字段進行切詞的操作 是否重新建立索引...

Lucene讀書筆記(三)

lucene索引文件格式 以上就是lucene的索引檔案的概念結構。lucene索引index由若干段 segment 組成,每一段由若干的文件 document 組成,每乙個文件由若干的域 field 組成,每乙個域由若干的項 term 組成。項是最小的索引概念單位,它直接代表了乙個字串以及其在檔...