Raft的PreVote實現機制

raft的prevote實現機制

在basic raft演算法中，當乙個follower與其他節點網路隔離，如下圖所示：

follower_2在electiontimeout沒收到心跳之後,會發起選舉，並轉為candidate。每次發起選舉時，會把term加一。由於網路隔離，它既不會被選成leader，也不會收到leader的訊息，而是會一直不斷地發起選舉。term會不斷增大。

一段時間之後，這個節點的term會非常大。在網路恢復之後，這個節點會把它的term傳播到集群的其他節點，導致其他節點更新自己的term，變為follower。然後觸發重新選主，但這個舊的follower_2節點由於其日誌不是最新，並不會成為leader。整個集群被這個網路隔離過的舊節點擾亂，顯然需要避免的。

raft作者博士**《consensus: bridging theory and practice》的第9.6節 "preventing disruptions when a server rejoins the cluster"提到了prevote演算法的大概實現思路。

在prevote演算法中，candidate首先要確認自己能贏得集群中大多數節點的投票，這樣才會把自己的term增加，然後發起真正的投票。其他投票節點同意發起選舉的條件是（同時滿足下面兩個條件）：

沒有收到有效領導的心跳，至少有一次選舉超時。 candidate的日誌足夠新（term更大，或者term相同raft index更大）。

prevote演算法解決了網路分割槽節點在重新加入時，會中斷集群的問題。在prevote演算法中，網路分割槽節點由於無法獲得大部分節點的許可，因此無法增加其term。然後當它重新加入集群時，它仍然無法遞增其term，因為其他伺服器將一直收到來自leader節點的定期心跳資訊。一旦該伺服器從領導者接收到心跳，它將返回到follower狀態，term和leader一致。

prevote是乙個典型的2pc協議，第一階段先徵求其他節點是否同意選舉，如果同意選舉則發起真正的選舉操作，否則降為follower角色。這樣就避免了網路分割槽節點重新加入集群，觸發不必要的選舉操作。

Raft的PreVote實現機制

Raft唯讀操作實現要點

raft原理的動畫演示

raft演算法的核心思想

Raft的PreVote實現機制

Raft唯讀操作實現要點

raft原理的動畫演示

raft演算法的核心思想

相關推薦