elasticsearch的詞彙表

2021-06-16 18:19:52 字數 2277 閱讀 5726

分析(analysis)

分析是把正文(full text)分解為語彙(terms)的過程。根據分析器的不同,短語: 「foo bar」, 「foo-bar」, 「foo,bar」 都會被分解成「foo」 和「bar」. 語彙是真正儲存在索引中的。

乙個全文的查詢(非語彙查詢),比如:「foo:bar」 會被分析器分解為「foo」,「bar」的語彙,進而匹配索引儲存的內容。

這個分析過程(包括建立索引階段和查詢階段)就使正文的全文查詢成為可能。

集群(cluster)

乙個集群包含具有相同集群名稱的乙個或者多個結點(nodes)。集群會在所有的結點中自動選擇乙個作為主節點(master node),如果主節點fail 則會自動選擇另外乙個結點作為主節點。

文件(document)

elasticsearch中的乙個document就是以json格式儲存的乙個文件。它類似於關聯式資料庫中的乙個表中的一條記錄。每乙個document儲存在乙個索引(index)中,並擁有唯一的型別(type)和標識(id)

每個document實際上是乙個json object物件(在其他語言中可以是hash,hashmap,或者關聯陣列),包含0個或者多個屬性(fields)或者鍵值對。

原生的json document 被儲存在_source 屬性裡。當直接搜尋乙個document的時候會預設返回。

標識(id)

id是文件(document)的唯一標識。乙個文件的index/type/id是唯一的。如果不提供id,系統會自動生成。

屬性(field)

乙個document包含一系列屬性(fields)或鍵值對。field的值可以是簡單型別,如string,integer或者date,也可以是複雜的陣列或者物件型別。field類似於關聯式資料庫中表列的概念。

索引(index)

結點(node)

結點指的是elasticsearch集群中執行的乙個例項。測試環境時可以在一台伺服器上起多個結點,通常來說一伺服器一節點。啟動時,結點通過單播(或者多播,如果指定)的方式在現有集群中尋找同名的集群,並自動加入。

主分片(primary shard)

每個document都儲存在單獨的主分片裡。當對乙個document做索引的時候,首先對主分片做索引,然後在所有主分片的副本(replicas)裡做索引。

預設乙個索引有5個主分片,可以調整主分片的數量以控制乙個索引中容納document的數量。索引建立之後,不可以更改主分片數。

副本分片(replica shard)

每個主分片可以有0個或者多個副本。副本是主分片的拷貝,有兩個作用:

1. 提高故障轉移效率:如果主分片宕機,副本分片可以被提公升至主分片。

2. 提高效能:搜尋訪問可以分布在主分片和副本分片之間。

預設每個主分片有乙個副本分片,但副本分片數量可以在已經存在的索引上動態調整。在同乙個結點上,副本分片不會被當做主分片啟動。

路由(routing)

分片(shard)

每個分片是乙個單獨的lucene例項,它是被elasticsearch管理的乙個個低等級的「worker」。乙個索引(index)是指向所有主分片和副本的邏輯命名空間。

在**級別,只需要關心索引就好了,不用關心索引裡的主分片和副本分片。

elasticsearch的分布式分片管理集群中的所有結點。而且當乙個結點失效的時候可以自動轉移失效結點的分片到其他結點。也可以自動新增新結點。

源屬性(source field)

預設json格式的document儲存在_source 屬性裡並且在所有的搜尋請求裡返回。這樣的好處是可以從搜尋結果裡就可以訪問到原始物件,而不用再通過id單獨訪問一次。

語彙(term)

語彙是在elasticsearch中索引的精確值。foo,foo,foo 這些語彙在elasticsearch中是不同的。terms可以通過term 查詢準確查詢。

正文(text)

正文是普通的非結構化文字,例如這篇文章。預設,正文是被分析器分解成多個語彙,儲存在索引中的。

正文需要在建立索引中被分析以便可以被搜尋,在搜尋正文的查詢中,查詢關鍵字也會被分析器拆分成與索引相同的語彙單元。

型別(type)

elasticsearch 使用同義詞

說明 在elasticsearch config目錄下,建立analysis目錄,並在analysis目錄下放入synonym.txt,在檔案首行加入下面一行同義詞,來進行測試西紅柿,番茄,聖女 es設定索引和自定 析器 put megacorp settings analyzer ik smart...

elasticsearch 動態同義詞

進行文件搜尋時,有時候需要用到同義詞搜尋。我平時做簡單搜尋時,都是在 測做分詞,同義詞做替換,然後拼寫dsl搜尋,但是碰到雙向同義詞和要求匹配度100 時,這種情況無法解決,所以需要在es測做同義詞處理。動態同義詞可以參考 補充說明 單向同義詞 boss,老大 主管 雙向同義詞 english,英語...

16 詞與詞的連線

操作 操作 機械 機械 旅行會社 旅行社 営業部 營業部 it產業 it產業 製品 產品 建築家 建築師 設計 設計 設計圖 形 造型,形狀 最新 最新 領帶 財布 錢包 革 皮革 布 布匹 水筒 水壺,水桶 綠 綠色,綠色植物 足 腳 指 手指 鼻 鼻子 顏 臉 頭 頭,頭腦 目 眼睛 身份證件 ...