Mapreduce框架的相關問題

jobtracker的單點故障：

jobtracker和hdfs的namenode一樣也存在單點故障，

單點故障一直是hadoop被人詬病的大問題，

為什麼hadoop的做的檔案系統和mapreduce計算框架都是高容錯的，但是最重要的管理節點的故障機制卻如此不好，我認為主要是namenode和jobtracker在實際執行中都是在記憶體操作，而做到記憶體的容錯就比較複雜了，只有當記憶體資料被持久化後容錯才好做，namenode和jobtracker都可以備份自己持久化的檔案，但是這個持久化都會有延遲，因此真的出故障，任然不能整體恢復，另外hadoop框架裡包含zookeeper框架，zookeeper可以結合jobtracker，用幾台機器同時部署jobtracker，保證一台出故障，有一台馬上能補充上，不過這種方式也沒法恢復正在跑的mapreduce任務。

Mapreduce框架的相關問題

MapReduce框架原理

MapReduce 框架原理

MapReduce框架中的Shuffle機制

Mapreduce框架的相關問題

MapReduce框架原理

MapReduce 框架原理

MapReduce框架中的Shuffle機制

相關推薦