Elasticsearch 分片原理1

elasticsearch版本：6.0

elasticsearch基於lucene，採用倒排索引寫入磁碟，lucene引入了按段搜尋的概念，來動態更新索引。

乙個lucene索引包含乙個提交點和三個短，如圖：

關於索引和分片乙個lucene索引在elasticsearch成為分片，乙個elasticsearch索引是分片的集合。

elasticsearch在索引中搜尋時，它傳送查詢到每乙個屬於索引的分片，然後合併每個分片的結果到乙個全域性的結果集。

按段寫入磁碟的流程如下：

1、新文件的lucene索引到達記憶體快取

2、提交後新的段新增到提交點，並清空記憶體快取

3、在從記憶體快取提交到磁碟的過程中，文件會先被寫入到檔案系統快取，這一步的代價比重新整理到磁碟的代價低，而在檔案快取就可以像其他檔案一樣被開啟讀取。而lucene在此時就可以對這個未完成提交的文件進行搜尋。

elasticsearch中，寫入和開啟乙個新段的過程叫refresh，預設情況每個分片每秒自動重新整理一次，所以稱elasticsearch是近實時搜尋的。文件的變化並不是立即對搜尋可見，但會在一秒之內變為可見。

重新整理時間可以手動指定

post /_refresh 重新整理（refresh）所有的索引。

post /blogs/_refresh 只重新整理（refresh） blogs 索引。

關閉或者設定重新整理時間
put /my_logs/_settings
put /my_logs/_settings

為了保證elasticsearch的可靠性，增加了translog事務日誌，每次elasticsearch的操作均進行了日誌記錄。

1.乙個文件被索引之後，就會被新增到記憶體緩衝區，並且追加到了 translog

2. 重新整理（refresh）完成後, 快取被清空但是事務日誌不會

3.這個程序繼續工作，更多的文件被新增到記憶體緩衝區和追加到事務日誌

4. 每隔一段時間--例如 translog 變得越來越大--索引被重新整理（flush）；乙個新的 translog 被建立，並且乙個全量提交被執行，並且事務日誌被清空

這個執行乙個提交並且截斷 translog 的行為在 elasticsearch 被稱作一次 flush 。分片每30分鐘被自動重新整理（flush），或者在 translog 太大的時候也會重新整理。

段合併

elasticsearch通過後台進行段合併，合併時會將舊的已刪除的文件從檔案系統清除。

1、兩個提交了的段和乙個未提交的段正在被合併到乙個更大的段

2、一旦合併結束，老的段被刪除

Elasticsearch 分片原理1

elasticsearch 分片選擇

ElasticSearch分片詳解

控制Elasticsearch分片和副本的分配

Elasticsearch 分片原理1

elasticsearch 分片選擇

ElasticSearch分片詳解

控制Elasticsearch分片和副本的分配

相關推薦