二 lucene索引 建立 域選項

2021-09-01 13:53:21 字數 1132 閱讀 5342

field.store.yes或者no(儲存域選項)

yes:將會儲存域值,原始字串的值會儲存在索引中,以此可以進行相應的恢復操作,對於主鍵,標題可以是這種方式儲存

no:不會儲存域值,通常與index.anaylized合起來使用,索引一些如文章正文等不需要恢復的文件

,此時內容無法完全還原(doc.get)

field.index(索引選項)

index.analyzed:進行分詞和索引,適用於標題、內容等

index.not_analyzed:進行索引,但是不進行分詞,如果身份證號,姓名,id等,適用於精確搜尋

index.analyzed_not_norms:進行分詞但是不儲存norms資訊,這個norms中包括了建立索引的時間和權值等資訊

index.not_analyzed_not_norms:即不進行分詞也不儲存norms資訊

index.no:不進行索引

最佳實踐:

索引選項

儲存選項

not_analyzed_not_norms    yes    識別符號(主鍵、檔名),**號碼,身份證號,姓名,日期

anaylzed                               yes    文件標題和摘要

anaylzed                               no    文件正文

no                                         yes    文件型別,資料庫主鍵(不進行索引)

not_analyzed                        no    隱藏關鍵字

索引檔案的初步認識:

_0.fdt

_0.fdx

---儲存域的值---

_0.fnm

---儲存域的名稱---

_0.frq

---分詞出現的頻率---

_0.nrm

---儲存評分資訊---

_0.prx

---位偏移量---

_0.tii

_0.tis

---索引資訊---

文件和域的概念很重要

文件相當於表中的每一條記錄,域相當於表中每乙個字段

3 學習Lucene3 5之索引建立 域選項

field string name,string value,field.store store,field.index index 方法解析 引數一 key 引數二 value 引數三 是否儲存到硬碟 儲存域選項 1.field.store.yes 表示把這個域中的內容完全儲存到檔案中,方便進行文...

Lucene 建立索引

public class indexer public static string indexdir d luceneindex public static void main string args system.out.println 被索引的文件個數 writer.numdocs catch ...

Lucene之建立索引

lucene用來建搜尋引擎要解決四個問題 抓取資料 解析資料 建立索引和執行搜尋。首先為每一篇文章新增標題 內容 寫作時間等資訊,從而寫好每一篇文章,然後將每一篇文章新增到書裡面去。這樣問及就寫好了。建立索引的過程如下 建立索引器indexwriter,這相當於一本書的框架。建立文件物件docmen...