Lucene學習筆記 一

2021-08-22 18:55:32 字數 617 閱讀 5480

在使用lucene開發搜尋引擎時,需要分成兩大模組。索引和搜尋,即indexer和searcher。顧名思義,indexer負責對文件簡歷索引,searcher負責在建立的索引上進行搜尋。

最基本的indexer在實現上需要以下幾個類

indexwriter 這個類主要負責建立修改索引。lucene也提供其它的類完成這個功能

directory 它是索引儲存路徑的抽象,它有2個子類,fsdirectory檔案系統路徑  ramdirectory記憶體路徑

analyzer 文字分析器,分析需要鎖定的文字。

document 被索引檔案的乙個抽象,包括很多field

field document的乙個組成部分,具有4個型別:keyword, unindexed, unstored, text

最基本的searcher在實現上大致需要以下幾個類

indexsearcher 這個類負責在indexwriter生成的索引上進行搜尋

term term是搜尋中的最小單位,它和indexer中的field相對應

query 所有query的抽象類,

termquery 最基本的query類,使用term作為搜尋單位

hits 包含一部分搜尋結果的指標

lucene學習筆記(一)

版本 lucene5.5 全文搜尋基本由三部分組成 索引部分 分詞部分 搜尋部分 建立索引基本步驟 1.建立directory directory directory new ramdirectory 建立在記憶體的索引 directory directory fsdirectory.open pa...

Lucene 學習筆記

調整索引索引效能 在乙個典型的索引應用中,程式效能的瓶頸存在於將索引檔案寫入磁碟的過程中。如果你曾經分析過索引過索引應用程式,應該會發現執行程式大部分時間都消耗在操作索引檔案的程式段上,因此我們必要使lucene索引新物件和修改索引檔案時變得更智慧型。當新的document物件新增到lucene的索...

lucene學習筆記

public class luceneadd catch exception e public class lucenesearch public static void main string args file indexdir new file d index try 在磁碟中檢索索引 dir...