Solr 學習總結之配置檔案內容

2021-06-20 17:40:25 字數 2529 閱讀 4196

solr 的三個配置檔案 solr.xml, solrconfig.xml , schema.xml.

solr.xml是solr第乙個查詢的配置檔案,

persistent意思為是否將註冊的例項的配置進行持久化動態註冊乙個例項,

就會到這裡新增乙個solrcore元素節點

"/admin/cores">  如果這裡沒有寫defaultcorename的話就會顯示所有的core實例子在開始的管理介面

"collection1" instancedir=「collection1」/>    

"ss60" instancedir="d:/03workspaces/solrquery/solrhome/ss60\"/>   

solr可以動態建立多個例項,instancedir可以是相對路徑,也可以是絕對路徑

solrconfig.xml可以配置 dataimport handler

schema.xml用來配置schema資訊的,以下是schema.xml配置資訊的url訪問形式

獲取schema.xml內容

獲取schema.xml中某個欄位的配置內容、等等測試的url位址

solrconfig.xml中內容的資訊

$ 用來配置索引生成的路徑,位置資訊

監聽update相關的事件:「postcommit」,「postoptimize」,此時可以用來觸發任何**。

根據索引的變化,可以更新快取的引數。

newsearcher和firstsearch的***,在事件觸發前可以做熱身搜尋,特別是在開機的時候,你也可以擴充套件寫另乙個事件***,在預熱的時候載入快取,增加每天的熱詞搜尋

定義乙個類繼承abstractsolreventlistener,

requestdispatcher 配置應該如何處理http請求的各個方面,包括http請求解析,遠端流**的支援,上傳檔案的大小等等。

httpcaching的配置,快取資訊的配置

requesthandler 用來處理solrqueryrequest,根據path找到的handler

updaterequestprocessorchain  處理solrqueryrequest的責任鏈

schema.xml檔案的配置:

field欄位屬性

omitnorms:norm是在index階段用來記錄對field的boost的資訊。使用norm會占用比較的多記憶體。一般來說只有full-text欄位或需要index階段boost的字段才會需要norms

compressed:欄位是需要壓縮的,導致索引和搜尋變慢,但是減少了儲存空間,只有strfield和textfield是可以壓縮,通常適用於長度超過200的字段

compressthreshold:屬性表示保證壓縮到不小於乙個大小(單位:char)

multivalued:此欄位可以儲存多個值

termvectors:當設定true,會儲存 term vector。當使用morelikethis或higlight的時候,用來作為相似詞的field應該儲存起來。

termpositions:儲存 term vector中的位址資訊,會消耗儲存開銷。 

termoffsets:儲存 term vector 的偏移量,會消耗儲存開銷。

fieldtype欄位屬性

sortmissinglast:"true" 表示沒有該field的資料排在有該field的資料之後,而不管請求時的排序規則 sortmissingfirst排序規則與sortmissinglast相反

omittermfreqandpositions(true|false):當為true時,省略這一領域的長遠頻率,位置和有效載荷

positionincrementgap:和multivalued一起使用,設定多個值之間的虛擬空白的數量,用在多值字段的匹配規則上。例如有乙個多值字段有2個值a和b。如果

positionincrementgap=0;那麼a和b對應的位置0,1,那麼查詢「a b」你是可以命中的。假如你不希望命中,你可以將positionincrementgap設定為100,這時,a和

b對應的位置0,101,那麼此時查詢「a b」將無結果。

precisionstep是在做範圍搜尋的時候起作用的,預設值是4;數值型別(int float double)在lucene裡都是以string形式儲存的,當然這個string是經過編碼的,

經過編碼後的string保證是順序的,也就是說num1>num2,那麼strnum1>strnum2。precisionstep用來分解編碼後的string,例如有乙個precisionstep,預設是4,也

就是隔4位索引乙個字首,比如0100,0011,0001,1010會被分成下列的二進位制位「0100,0011,0001,1010","0100,0011,0001",0100,0011","0100"。這個值越大,那

麼索引就越小,那麼範圍查詢的效能(尤其是細粒度的範圍查詢)也越差;這個值越小,索引就越大,那麼效能越差。

>

Solr配置檔案說明

分類 搜尋引擎 solr 2012 10 31 16 00 2003人閱讀收藏 舉報目錄 執行solr是個很簡單的事,如何讓solr高效執行你的專案,這個就不容易了。要考慮的因素太多。這裡很重要乙個就是對solr的配置要了解。懂得配置檔案每個配置項的含義,這樣操作起來就會如魚得水!在solr裡面主要...

solr的配置檔案solrconfig

solr 主目錄結構 乙個執行的solr 服務其主目錄包含了solr 的配置檔案和資料 lucene 的索引檔案 solr 的主目錄展開後為如下結構 bin 建議將集群複製指令碼放在這個目錄下。conf 放置配置檔案。conf schema.xml 建立索引的schema 包含了字段型別定義和其相關...

使用solr進行配置檔案

我現在使用的是乙個已經搭建好的solr環境下進行的測試 第一步,需要配置solrhome中的乙個配置檔案schema.xml 配置內容如下,上面配置的是ik分詞器,下面是配置完成的域.因為我在這個需要使用的solr進行全文檢索的只有這幾個重要的字段.然後內容如下 class solr.textfie...