ElasticSearch(二)核心概念

2022-04-25 04:39:15 字數 2472 閱讀 7811

(1)near realtime(nrt):近實時,兩個意思,從寫入資料到資料可以被搜尋到有乙個小延遲(大概1秒);基於es執行搜尋和分析可以達到秒級

(2)cluster:集群,包含多個節點,每個節點屬於哪個集群是通過乙個配置(集群名稱,預設是elasticsearch)來決定的,對於中小型應用來說,剛開始乙個集群就乙個節點很正常

(3)node:節點,集群中的乙個節點,節點也有乙個名稱(預設是隨機分配的),節點名稱很重要(在執行運維管理操作的時候),預設節點會去加入乙個名稱為「elasticsearch」的集群,如果直接啟動一堆節點,那麼它們會自動組成乙個elasticsearch集群,當然乙個節點也可以組成乙個elasticsearch集群

(4)document&field:文件,es中的最小資料單元,乙個document可以是一條客戶資料,一條商品分類資料,一條訂單資料,通常用json資料結構表示,每個index下的type中,都可以去儲存多個document。乙個document裡面有多個field,每個field就是乙個資料字段。

product document

商品index,裡面存放了所有的商品資料,商品document

但是商品分很多種類,每個種類的document的field可能不太一樣,比如說電器商品,可能還包含一些諸如售後時間範圍這樣的特殊field;生鮮商品,還包含一些諸如生鮮保質期之類的特殊field

type,日化商品type,電器商品type,生鮮商品type

日化商品type:product_id,product_name,product_desc,category_id,category_name

電器商品type:product_id,product_name,product_desc,category_id,category_name,service_period

生鮮商品type:product_id,product_name,product_desc,category_id,category_name,eat_period

每乙個type裡面,都會包含一堆document

(7)shard:單台機器無法儲存大量資料,es可以將乙個索引中的資料切分為多個shard,分布在多台伺服器上儲存。有了shard就可以橫向擴充套件,儲存更多資料,讓搜尋和分析等操作分布到多台伺服器上去執行,提公升吞吐量和效能。每個shard都是乙個lucene index。

(8)replica:任何乙個伺服器隨時可能故障或宕機,此時shard可能就會丟失,因此可以為每個shard建立多個replica副本。replica可以在shard故障時提供備用服務,保證資料不丟失,多個replica還可以提公升搜尋操作的吞吐量和效能。

primary shard(建立索引時一次設定,不能修改,預設5個),副本(隨時修改數量,預設1個),預設每個索引10個shard,5個primary shard,5個replica shard,最小的高可用配置,是2臺伺服器。

elasticsearch 資料庫

field     字段

document   行

type      表

index     庫

shard 和replica:

(1)index包含多個shard

(2)每個shard都是乙個最小工作單元,承載部分資料,lucene例項,完整的建立索引和處理請求的能力

(3)增減節點時,shard會自動在nodes中負載均衡

(4)primary shard和replica shard,每個document肯定只存在於某乙個primary shard以及其對應的replica shard中,不可能存在於多個primary shard

(5)replica shard是primary shard的副本,負責容錯,以及承擔讀請求負載(讀請求承擔負載)

(6)primary shard的數量在建立索引的時候就固定了,replica shard的數量可以隨時修改

(7)primary shard的預設數量是5,replica預設是1(這邊1的意思是,每個primary shard對應有1個replica shard,所以預設是10個shard),預設有10個shard,5個primary shard,5個replica shard

(8)primary shard不能和自己的replica shard放在同乙個節點上(否則節點宕機,primary shard和副本都丟失,起不到容錯的作用),但是可以和其他primary shard的replica shard放在同乙個節點上

(9)設定index有3個primary shard,3個replica shard

put /test_index

}

2020 9 1Elasticsearch核心概念

id brandname describe 1小公尺手機 手機中的戰鬥機 2小公尺nfc手機 小公尺手機,支援。3nfc手機 4 小公尺耳機 5 紅公尺耳機 10000000 機械人如果要搜尋小公尺nfc智慧型手機 select from product where brand like 小公尺nf...

核光滑方法 二

昨天聽了實驗室師兄的報告,會後詢問他看es l 的事宜。師兄說你不實現書中的演算法就是偷懶,想想確實是這樣。多維空間的表示式 如下 mi n x 0 i 1nk x0 xi yi b xi t x0 2k x0,x d x x0 是歐幾里得範數,也就是 x x1 2 xp 2 書中說分數會趨向於 1...

二 elasticsearch入門(資料)

程式中大多的實體或物件能夠被序列化為包含鍵值對的json物件,鍵 key 是字段 field 或屬性 property 的名字,值 value 可以是字串 數字 波爾型別 另乙個物件 值陣列或者其他特殊型別,比如表示日期的字串或者表示地理位置的物件。accounts 文件元資料 乙個文件不只有資料。...