分布式鎖02 zookeeper

一.簡介

zookeeper 是google 的 chubby乙個開源的實現，是 hadoop 的分布式協調服務。

它包含乙個簡單的原語集，分布式應用程式可以基於它實現同步服務，配置維護和命名服務等。

為什麼使用zookeeper：

大部分分布式應用需要乙個主控、協調器或控制器來管理物理分布的子程序（如資源、任務分配等）

目前，大部分應用需要開發私有的協調程式，缺乏乙個通用的機制

協調程式的反覆編寫浪費，且難以形成通用、伸縮性好的協調器

zookeeper：提供通用的分布式鎖服務，用以協調分布式應用

zookeeper能幫我們做什麼？

hadoop2.0,使用zookeeper的事件處理確保整個集群只有乙個活躍的namenode,儲存配置資訊等。

hbase,使用zookeeper的事件處理確保整個集群只有乙個hmaster,察覺hregionserver聯機和宕機,儲存訪問控制列表等。

二.分布式鎖

分布式鎖，這個主要得益於zookeeper為我們保證了資料的強一致性。鎖服務可以分為兩類，乙個是保持獨佔，另乙個是控制時序。

所謂保持獨佔，就是所有試圖來獲取這個鎖的客戶端，最終只有乙個可以成功獲得這把鎖。通常的做法是把zk上的乙個znode看作是一把鎖，通過 create znode的方式來實現。所有客戶端都去建立 /distribute_lock 節點，最終成功建立的那個客戶端也即擁有了這把鎖。

控制時序，就是所有檢視來獲取這個鎖的客戶端，最終都是會被安排執行，只是有個全域性時序了。做法和上面基本類似，只是這裡 /distribute_lock 已經預先存在，客戶端在它下面建立臨時有序節點（這個可以通過節點的屬性控制：createmode.ephemeral_sequential來指定）。zk的父節點（/distribute_lock）維持乙份sequence,保證子節點建立的時序性，從而也形成了每個客戶端的全域性時序。

三.zookeeper的幾個性質

1.有序節點：假如當前有乙個父節點為/lock，我們可以在這個父節點下面建立子節點；zookeeper提供了乙個可選的有序特性，例如我們可以建立子節點「/lock/node-」並且指明有序，那麼zookeeper在生成子節點時會根據當前的子節點數量自動新增整數序號，也就是說如果是第乙個建立的子節點，那麼生成的子節點為/lock/node-0000000000，下乙個節點則為/lock/node-0000000001，依次類推。

2.臨時節點：客戶端可以建立乙個臨時節點，在會話結束或者會話超時後，zookeeper會自動刪除該節點。

3.事件監聽：在讀取資料時，我們可以同時對節點設定事件監聽，當節點資料或結構變化時，zookeeper會通知客戶端。當前zookeeper有如下四種事件：1）節點建立；2）節點刪除；3）節點資料修改；4）子節點變更。

四.zookeeper實現分布式鎖

假設鎖空間的根節點為/lock：

1.客戶端連線zookeeper，並在/lock下建立臨時的且有序的子節點，第乙個客戶端對應的子節點為/lock/lock-0000000000，第二個為/lock/lock-0000000001，以此類推。

2.客戶端獲取/lock下的子節點列表，判斷自己建立的子節點是否為當前子節點列表中序號最小的子節點，如果是則認為獲得鎖，否則監聽/lock的子節點變更訊息，獲得子節點變更通知後重複此步驟直至獲得鎖；

3.執行業務**；

4.完成業務流程後，刪除對應的子節點釋放鎖。

步驟1中建立的臨時節點能夠保證在故障的情況下鎖也能被釋放，考慮這麼個場景：假如客戶端a當前建立的子節點為序號最小的節點，獲得鎖之後客戶端所在機器宕機了，客戶端沒有主動刪除子節點；如果建立的是永久的節點，那麼這個鎖永遠不會釋放，導致死鎖；由於建立的是臨時節點，客戶端宕機後，過了一定時間zookeeper沒有收到客戶端的心跳包判斷會話失效，將臨時節點刪除從而釋放鎖。

另外細心的朋友可能會想到，在步驟2中獲取子節點列表與設定監聽這兩步操作的原子性問題，考慮這麼個場景：客戶端a對應子節點為/lock/lock-0000000000，客戶端b對應子節點為/lock/lock-0000000001，客戶端b獲取子節點列表時發現自己不是序號最小的，但是在設定***前客戶端a完成業務流程刪除了子節點/lock/lock-0000000000，客戶端b設定的***豈不是丟失了這個事件從而導致永遠等待了？這個問題不存在的。因為zookeeper提供的api中設定***的操作與讀操作是原子執行的，也就是說在讀子節點列表時同時設定***，保證不會丟失事件。

最後，對於這個演算法有個極大的優化點：假如當前有1000個節點在等待鎖，如果獲得鎖的客戶端釋放鎖時，這1000個客戶端都會被喚醒，這種情況稱為「羊群效應」；在這種羊群效應中，zookeeper需要通知1000個客戶端，這會阻塞其他的操作，最好的情況應該只喚醒新的最小節點對應的客戶端。應該怎麼做呢？在設定事件監聽時，每個客戶端應該對剛好在它之前的子節點設定事件監聽，例如子節點列表為/lock/lock-0000000000、/lock/lock-0000000001、/lock/lock-0000000002，序號為1的客戶端監聽序號為0的子節點刪除訊息，序號為2的監聽序號為1的子節點刪除訊息。

可以直接使用curator這個開源專案提供的zookeeper分布式鎖實現

參考：

分布式鎖02 zookeeper

zookeeper分布式鎖

zookeeper分布式鎖

zookeeper 分布式鎖

相關推薦