《Elasticsearch 權威指南》閱讀筆記

2021-10-05 05:46:34 字數 1140 閱讀 4191

原文:

elasticsearch: 權威指南

技術上來說,乙個主分片最大能夠儲存 integer.max_value - 128 個文件,但是實際最大值還需要參考你的使用場景:包括你使用的硬體, 文件的大小和複雜程度,索引和查詢文件的方式以及你期望的響應時長。

索引在預設情況下會被分配5個主分片

如果你的資料沒有自然的 id, elasticsearch 可以幫我們自動生成 id 。 請求的結構調整為: 不再使用 put 謂詞(「使用這個 url 儲存這個文件」), 而是使用 post 謂詞(「儲存文件在這個 url 命名空間下」)。

自動生成的 id 是 url-safe、 基於 base64 編碼且長度為20個字元的 guid 字串。 這些 guid 字串由可修改的 flakeid 模式生成,這種模式允許多個節點並行生成唯一 id ,且互相之間的衝突概率幾乎為零。

當主分片把更改**到副本分片時, 它不會**更新請求。 相反,它**完整文件的新版本。請記住,這些更改將會非同步**到副本分片,並且不能保證它們以傳送它們相同的順序到達。 如果elasticsearch僅**更改請求,則可能以錯誤的順序應用更改,導致得到損壞的文件。

consistency,即一致性。在預設設定下,即使僅僅是在試圖執行乙個_寫_操作之前,主分片都會要求 必須要有 規定數量(quorum)(或者換種說法,也即必須要有大多數)的分片副本處於活躍可用狀態,才會去執行_寫_操作(其中分片副本可以是主分片或者副本分片)。這是為了避免在發生網路分割槽故障(network partition)的時候進行_寫_操作,進而導致資料不一致。_規定數量_即:

int( (primary + number_of_replicas) / 2 ) + 1

三颱機器,有一台不可用,但是副本分片預設延遲一分鐘重新生成,會導致1分鐘內只有乙個主分片,即1分鐘內都會拒絕請求

elasticsearch 不只會_儲存(stores)_ 文件,為了能被搜尋到也會為文件新增_索引(indexes)_ ,這也是為什麼我們使用結構化的 json 文件,而不是無結構的二進位制資料。

** elasticsearch doc values 和倒排索引

lucene doc value結構自己的一點理解

深入理解elasticsearch寫入過程

mastering elasticsearch(中文版)

ElasticSearch權威指南學習(索引管理)

當我們需要確保索引被建立在適當數量的分片上,在索引資料之前設定好分析器和型別對映。手動建立索引,在請求中加入所有設定和型別對映,如下所示 put my index 你可以通過在 config elasticsearch.yml 中新增下面的配置來防止自動建立索引。action.auto create...

Hadoop 權威指南

rpm包和deb包是兩種linux系統下最常見的安裝包格式,在安裝一些軟體或服務的時候免不了要和它們打交道。rpm包主要應用在redhat系列包括 fedora等發行版的linux系統上,deb包主要應用於debian系列包括現在比較流行的ubuntu等發行版上。yum可以用於運作rpm包,例如在f...

HTTP權威指南

web 伺服器會為所有 http 物件資料附加乙個 mime 型別,content type image jpeg,content length 12984 伺服器資源名被稱為統一資源識別符號 uniform resource identifier,uri uri 就像網際網路上的郵政位址一樣,在世...