ZKFC支援HDFS HA的原理

ha首先是啟動兩個namenode，乙個是active狀態，乙個是standby,當active掛掉後，standby通過zookeepe會自動迅速的替代上。這樣集群就會非常的可靠。zookeeper如何知道namenode是active或standby狀態呢？他是通過兩個程序來知道的，叫做zookeeper failovecontroller（故障排除控制器） active 和zookeeper failovecontroller standby 。簡稱 zkfc, 兩個namenode會定時的向這兩個程序匯報。也就是傳送心跳報告，然後zookeeper就通過zkfc會得到這些資訊。如果zookeeper沒有收到zkfc某個namenode傳送的心跳，那麼zookeeper就會認為這台機器掛掉了，然後zcfc active會釋放鎖給到zookeeper, 然後zkfcstantby就會獲得這鎖，把nnstandby啟動為nnactive狀態，在啟動過程中他會先把另乙個已經掛掉的namenode給kill掉，防止腦裂，因為nnactive向zkfc傳送心跳資訊時可能會有特殊情況導致誤報。所以要kill掉，防止腦裂。

兩個namenode最重要的是資料同步，也就是同步元資料資訊以及日誌檔案。在整個ha架構中，只要datanode的資料發生改變，namenodeactive會實時的把元資料資訊以及日誌檔案寫入到journalnode(journal 日誌)，journalnode的數量可以自己設定數量，一般設定為三個，保證高可用，namenode把元資料資訊以及日誌檔案寫到journalnode以後，namenodestandby會實時的把裡面的資料讀到本地。這樣就會保證資料的一致性。

failovecontroller 故障排除控制器 high ability。高可用 hdfs集群中namenode存在單點故障，對於只有乙個namednode的集群，如果namenode機器出現故障downtime, 比如說停電了，或者說硬體損壞，那麼整個集群將無法使用，直到管理員手動啟動namenode 才可以繼續使用集群，但是機房我們不可能隨時都有人守著，所以我們需要配置乙個ha，

影響hdfs集群不可用主要包括以下兩種情況

namenode機器宕機,將導致集群不可用,重啟 namenode之後オ可使用

計畫內的軟體或硬體公升級( namenode節點),導致集群在短時間內不可用

hdfs的ha就是為了解決上述問題,通常由兩個 namenode組成,乙個處於active狀態,另乙個處於 standby狀態。 active namenode對外提供服務,比如處理來自客戶端的rpc請求,而 standby namenode則不對外提供服務,僅同步 active namenode的狀態,以便能夠在它失敗時快速進行切換。

ZKFC支援HDFS HA的原理

支援向量機的原理

支援向量機SVM原理

SVM 支援向量機原理

ZKFC支援HDFS HA的原理

支援向量機的原理

支援向量機SVM原理

SVM 支援向量機 原理

相關推薦

SVM 支援向量機原理