solr配置檔案schema檔案中字段的介紹

2021-07-15 17:05:49 字數 2852 閱讀 3736

一.schema檔案的作用:定義索引的文當的型別和字段,類似於資料庫表定義。

二.常用字段的詳解:

fields各個屬性說明:

name:

必須屬性

- 欄位名

type:

必須屬性

- 中定義的字段型別

indexed: 如果字段需要被索引(用於搜尋或排序),屬性值設定為

true

stored:

如果字段內容需要被返回顯示,值設定為

true

multivalued:

如果這個欄位在每個文件中可能包含多個值,設定為true

required:

字段必須有值,否則會拋異常

default:

在增加文件時,可

以根據需要為字段設定乙個預設值,防止為空

termvectors: [false]

設定為true

後,會儲存所給字段的相關向量(

vector

)當使用

morelikethis時,

用於相似度判斷的字段需要設定為

stored

來達到最佳效能

.termpositions:

儲存和向量相關的位置資訊,會增加儲存開銷

termoffsets:

儲存offset

和向量相關的資訊,會增加儲存開銷

docvalues:

如果這個字段應該有文件值(

doc values

),設定為

true

。文件值在門

面搜尋,分組,排序和函式查詢中會非常有用。雖然不是必須的,而且會導致生成

索引變大變慢,但這樣設定會使索引載入更快,更加

nrt友好,更高的記憶體使用效率。

然而也有一些使用限制:目前僅支援

strfield, uuidfield

和所有trie*fields,

並且依賴字段型別

, 可能要求欄位為單值(

single-valued)的,

必須的或者有預設值。 id

三.效能優化:

盡量將所有僅用於搜尋,而不用於實際返回的字段設定stored="false";

- 盡量將所有僅用於返回,而不用於搜尋的字段設定indexed="false";

- 去掉所有不需要的copyfield 語句;

- 為了達到最佳的索引大小和搜尋效能,對所有的文字字段設定indexed="false",

使用copyfield將他們拷貝到「整合字段」name="text"的字段中,使用整合字段進行搜尋;

- 使用server模式來執行jvm,同時將log級別調高, 避免輸出所有請求的日誌。

注意: 為了節省空間,這個字段預設不被索引, 因使用copyfield被拷貝到了名為text的字段中 ,用於內容返回和高亮。搜尋時使用text欄位

indexed="false"  stored="true"

multivalued="true"/>

整合字段

(copyfiled ),

包含其他可搜尋的字段,當整合字段包含多個需要被索引的字段時multivalued="true

「必須設定為true

indexed="true"  stored="false"

multivalued="true"/>

拷貝需要索引的字段到整合欄位中

四 indexed,和stored欄位使用案例

1. 當設定assetstitle的indexed=「true」,stored=」true」

時,即此字段被搜尋,可顯示內容;

2. 當設定assetstitle的indexed=「true」,stored=」false」

時,即此段被搜尋,不顯示內容;

通過此欄位查詢,可以查詢到資料,但字段的內容在顯示的結果中不顯示。

3.當設定assetstitle的indexed=「false」,stored=」true」時,即通過assetstittle(assetstitle:*****)進行查詢,將查詢不到資料(但assetstitle的資料是在solr庫中是儲存存在的);當換乙個字段進行查詢,返回的結果中,assetstitle欄位的內容可以顯示。

即此字段為了返回內容顯示,不被搜尋

,可以進行此種情形的設定。

4. 當設定assetstitle的indexed=「false」,stored=」false」時,即此字段不被搜尋,不被顯示內容,通過

assetstitle

進行查詢,查詢不到(此字段的資料在

solr

庫中沒有儲存),通過其他字段查詢,顯示的結果中也沒有

assetstitle

欄位的內容;即此字段不被搜尋,不被顯示。

Solr配置檔案說明

分類 搜尋引擎 solr 2012 10 31 16 00 2003人閱讀收藏 舉報目錄 執行solr是個很簡單的事,如何讓solr高效執行你的專案,這個就不容易了。要考慮的因素太多。這裡很重要乙個就是對solr的配置要了解。懂得配置檔案每個配置項的含義,這樣操作起來就會如魚得水!在solr裡面主要...

solr的配置檔案solrconfig

solr 主目錄結構 乙個執行的solr 服務其主目錄包含了solr 的配置檔案和資料 lucene 的索引檔案 solr 的主目錄展開後為如下結構 bin 建議將集群複製指令碼放在這個目錄下。conf 放置配置檔案。conf schema.xml 建立索引的schema 包含了字段型別定義和其相關...

使用solr進行配置檔案

我現在使用的是乙個已經搭建好的solr環境下進行的測試 第一步,需要配置solrhome中的乙個配置檔案schema.xml 配置內容如下,上面配置的是ik分詞器,下面是配置完成的域.因為我在這個需要使用的solr進行全文檢索的只有這幾個重要的字段.然後內容如下 class solr.textfie...