solr核心組成

2021-08-13 14:59:01 字數 1213 閱讀 8726

solr的例項類似於關聯式資料庫找那個的表結構,核心配置檔案為 managed-schema

managed-schema 檔案主要包含三部分:字段(field),字段型別(fieldtype) ,唯一鍵(uniquekey)

solr採用的是一種反向索引,就是重關鍵字到文件的對映過程,儲存這種對映這種資訊的所以稱為反向索引

使用分詞元件將文件分成乙個個單獨的單詞,去除標點符號,去除停詞

使用語言處理元件 變為小寫,將單詞縮減為詞根的形式,如cars到car等,將單詞轉變為慈耿形式如drove到drive等,語言處理元件處理得到的結果成為詞

索引元件,利用得到的詞建立乙個字典,對詞進行排序,合併相同的詞和詞出現的文件

需要執行在乙個web容器中,4.x 需要jdk1.7 6.x jdk1.8

schema.xml 主要配置欄位名及字段的型別等資訊

field 字段

字段定義方式

name 欄位名稱

type 字段型別

indexed 是否索引

stored 是否儲存

require 是否必須

multivalued 是否多值

dynamicfield 動態字段

字段定義

name 欄位名稱 通過萬用字元來表示

type 字段型別,使用時候必須使用儲存型別一致

例如:

year_is 欄位並沒有在schema.xml 中配置,通過*_is 動態欄位來配置,字段型別為int型別

uniquekey 唯一主鍵

指定乙個主鍵的字段,每個例項中必須有且只有乙個唯一的主鍵

copyfield 複製字段

source **字段

dest 目標字段

將源字段的內容複製到目標欄位中,例如:如果要實時對標題和正文同時進行查詢,需要定義乙個新字段,將標題和正文複製到這個新字段,索引的時候,直接從這個新字段查詢

fieldtype 字段型別

name 名字

class 類名 也是solr中真正的型別的類名

如果fieldtype 是solr.textfiled類,可以配置分詞器,

type:index (索引分詞器),query(搜尋分詞器)

tokenizer:分詞器

filter:過濾器

例如:

配置分詞

查詢分詞

Solr核心(核心)

solr核心 core 是lucene索引的執行例項,包含使用它所需的所有solr配置檔案。我們需要建立乙個solr core來執行索引和分析等操作。solr應用程式可以包含乙個或多個核心。如果需要,solr應用程式中的兩個核心可以相互通訊。安裝和啟動solr後,可以連線到solr的客戶端 web介...

Centos 核心核心組成

linux核心,相當於linux大腦,高可靠和高穩定都是針對核心來說 完整linux核心組成部分 1.記憶體管理 合理有效的管理整個系統的物理記憶體,同時快速響應核心各子系統對記憶體分配的請求 2.程序管理 每個程序都會分得一定的時間片,然後程序排程器根據時間片的不同,選擇每個程序依次執行。本質上是...

Linux 核心組成

linux 核心是乙個龐大而複雜的作業系統的核心,不過儘管龐大,但是卻採用子系統和分層的概念很好地進行了組織。通過本專題,我們可以學習 linux 的分層架構 核心配置和編譯 核心效能除錯和 linux 2.6 中的許多提公升功能。linux 核心組成 linux 核心的主要元件有 系統呼叫介面 程...