Lucene入門之建立索引

2021-05-01 20:58:12 字數 1658 閱讀 1312

1,

建立索引器

indexwriter 2,

建立文件物件

document 3,

建立資訊字段物件

field 4,

將field

新增到document

裡面5,

將document

新增到indexwriter 6,

關閉indexwriter

field field=new field(field

名稱,field內容,

儲存方式

,索引方式)

引數的含義:

field

名稱:就是

field

起的名字,類似資料表的欄位名稱

field

內容:field

的內容,類似資料表的字段內容

儲存方式:

不儲存field.store.no

索引太大的情況

,不利於效率,如正文

完全儲存

field.store.yes

索引不太大的情況,如標題

壓縮儲存

field.store.compress

索引內容較多的情況,如正文

索引方式:

索引方式

理解應用

field.index.no

不索引只需要跟著搜尋結果顯示出來卻不需要按照其內容進行搜尋

field.index.tokenized

索引並分詞

適合模糊搜尋,如標題,全文

field.index.no_norms

索引但不分析

field.index.un_tokenized

索引但不分詞

適合精確搜尋

document doc=new document()

建立乙個不含有任何

field

的空的document.

新增

field

doc.add(field);

indexwriter writer=new indexwriter(

存放索引的路徑,分析器的例項);

indexwriter writer=new indexwriter(「myindex」,new cjkanalyzer());

新增

document

writer.adddocument(doc);

關閉索引器

writer.close();

簡單索引:

******indexer

package example.example;

import org.apache.lucene.document.document;

import org.apache.lucene.document.field;

import org.apache.lucene.index.indexwriter;

import org.apache.lucene.analysis.standard.standardanalyzer;

public class ******indexer

}

Lucene之建立索引

lucene用來建搜尋引擎要解決四個問題 抓取資料 解析資料 建立索引和執行搜尋。首先為每一篇文章新增標題 內容 寫作時間等資訊,從而寫好每一篇文章,然後將每一篇文章新增到書裡面去。這樣問及就寫好了。建立索引的過程如下 建立索引器indexwriter,這相當於一本書的框架。建立文件物件docmen...

Lucene之索引建立入門級例項

是否對域的內容進行分詞處理,前提是我們要對域的內容進行查詢 將field分析後的詞或整個field值進行索引,只有索引方可搜尋到 比如 商品名稱 商品簡介分析後進行索引,訂單號 身份證號不用分析但也要索引,這些將來都要作為查詢條件。將field值儲存在文件中,儲存在文件中的field才可以從docu...

Lucene 建立索引

public class indexer public static string indexdir d luceneindex public static void main string args system.out.println 被索引的文件個數 writer.numdocs catch ...