大資料學習之路91 Hadoop配置為高可用

我們之前一直沒有配置過hadoop的高可用，今天我們就來配置一下

之前我們的namenode只要一掛，則整個hdfs集群就完蛋。雖然我們可以通過重啟的方式來恢復，可是我們重啟好之前，我們的hdfs集群就不能提供服務了。所以它存在單點故障問題。

我們可以設定兩台namenode ,一台為active,另一台為standby

active對外提供服務，而standby則不斷的和active同步元資料。但這個元資料在hadoop中不是直接讓他們就同步，而是在一開始的時候，讓兩個namenode保持相同的fsimage。當集群執行起來之後，active的記憶體中會不斷的產生元資料。而且不光是產生元資料，還會將引起元資料變化的操作記錄成日誌。

namenode在高可用的模式下，不光會將日誌記錄在本地，還會將日誌記錄在日誌管理系統裡面，這個分布式的日誌管理系統，叫qjournal分布式日誌管理系統。qjournal是乙個集群，它裡面會有很多臺機器，可以實現資料的可靠儲存，他會將日誌檔案記錄在很多臺伺服器上，當然這些伺服器肯定有本地目錄，而且它還有乙個特點，就是只要有半數以上的機器還在，就可以正常的提供對外服務，這個就和zookeeper有點像了，為什麼說它和zookeeper有點像呢？因為他們所用的資料同步的策略相同。zookeeper及資料時候也是記錄在很多臺，也需要進行同步的。他們是通過paxos演算法做資料一致性的同步。所以一般有奇數臺節點比較合適，並且存活半數以上，這個集群就能正常執行。所以它是很可靠的，他一般不會掛。而這個系統是基於zookeeper開發的。沒有zookeeper是執行不起來的。所以我們還要引入zookeeper集群。

反正這麼一來active就把這些日誌記錄到qjournal集群中的伺服器中了。然後

大資料學習之路91 Hadoop配置為高可用

我的hadoop大資料之路（二）

大資料學習之路

大資料Hadoop學習六

大資料學習之路91 Hadoop配置為高可用

我的hadoop大資料之路（二）

大資料學習之路

大資料Hadoop學習六

相關推薦