solr索引建立流程

2021-09-07 10:47:47 字數 734 閱讀 8871

solr索引建立流程:

分詞元件tokenizer

分詞元件(tokenizer)會做以下幾件事情(這個過程稱為:tokenize),處理得到的結果是詞彙單元(token)。

1、將文件分成乙個乙個單獨的單詞。

2、去除標點符號。

3、去除停詞(stop word)。

語言處理元件

語言處理元件(linguistic processor)主要是對得到的詞元(token)做一些語言相關的處理。對於英語,語言處理元件(linguistic processor)一般做以下幾點:  

1、變為小寫(lowercase)

2、將單詞縮減為詞根形式

3、將單詞轉換為詞根形式

索引元件(indexer)

1、利用得到的詞(term)建立乙個字典

2、對欄位進行排序

3、合併相同的詞和詞出現的文件

solr建立查詢索引

1 建立solrserver物件 try catch exception e 2 新增索引 collectiondocs newarraylist for int i 0 i list.size i try catch exception e 3 使用bean物件新增索引 建立乙個對應於solr索引...

solrj操作solr索引庫 流程

宣告 博主自己記錄以免忘記,所以無邏輯無參考價值。小女子就是醬紫任性 首先dao層 訪問索引庫的類。定義一些通用的資料訪問方法。業務邏輯就是查詢索引庫。引數 solrquery物件 業務邏輯 1 根據query物件進行查詢。2 返回查詢結果。list 查詢結果的總記錄數。需要把返回結果封裝到pojo...

SOLR對多個(關聯)表建立索引

首先在資料庫建立一張表,本來有乙個tuser表了,我又建立了乙個role表,就兩三個字段,沒什麼特殊的,然後在裡面隨便新增幾條資料即可,看一下資料庫 資料庫建立完成之後就是修改data config.xml檔案了,因為資料庫跟solr之間的關聯主要就是建立在這個檔案上面的,所以接下來就是修改該檔案了...