Lucene初步學習 一

2021-08-21 19:41:11 字數 1212 閱讀 7927

public class indexwriter
indexwriter是在索引過程中中的中心元件,它不是唯一用來修飾索引的類,這個類建立乙個新的索引並且新增到乙個已有的索引中。

public abstract class diretory
directorys是抽象類,用來表示lucene索引的位置,有以下兩個實現:

public abstract class analyzer
analyzer用作分詞,文件在被索引前需要通過分詞處理。analyzer把分詞後的內容交給indexwriter處理。

analyzer analyzer=new standardanalyzer();
standardanalyzer是通常使用的一種analyzer

document記錄資料,field儲存了對document的描述。field和document相互依存。

document內部實現的幾個方法

增、刪、查等

/** 為document新增field */

public final void add(indexablefield field)

/** 刪除乙個field */

public final void removefield(string field)

/** 根據field名稱找出field, 如果多個field名稱一樣,返回第乙個 */

public final indexablefield getfield(string name)

/** 返回能讀懂的document內容 */

public final sting tostring()

/** 把document中的所有field移除*/

public void clear()

field是document的一部分,每乙個field都有三部分組成:名稱name,型別type,值value。目前大約有十多種功能各異的fields: textfield,stringfield,intpoint,longpoint,floatpoint,doublepoint,sorteddocvaluesfield,sortedsetvaluesfield,numericadocvaluesfield,sortednumericdocvaluesfield,sotedfield。

lucene學習筆記(一)

版本 lucene5.5 全文搜尋基本由三部分組成 索引部分 分詞部分 搜尋部分 建立索引基本步驟 1.建立directory directory directory new ramdirectory 建立在記憶體的索引 directory directory fsdirectory.open pa...

Lucene學習筆記 一

在使用lucene開發搜尋引擎時,需要分成兩大模組。索引和搜尋,即indexer和searcher。顧名思義,indexer負責對文件簡歷索引,searcher負責在建立的索引上進行搜尋。最基本的indexer在實現上需要以下幾個類 indexwriter 這個類主要負責建立修改索引。lucene也...

pytorch初步學習(一)

最近在學習神經網路以及深度學習,在老師建議下是從pytorch開始入手,但是在直接看到網路也是比較懵的狀態,所以購買了一本書籍開始學習一些基礎的概念以及引數意義,最開始就先從最簡單的書籍上講解的順序開始記錄下自己學習的過程及理解。當然首先需要安裝環境及配置,安裝cuda 前提最好時英偉達顯示卡 首先...