部落格242 分布式中的故障恢復

2021-10-05 18:26:58 字數 690 閱讀 5135

內容:記錄分布式中的故障恢復方法

故障型別:

故障型別通常包括兩類:

1、物理故障,比如硬碟損壞、斷電斷網、硬體公升級等;

2、軟體層故障,比如系統存在 bug 導致系統崩潰、系統負載過高導致系統崩潰等。

在討論分布式系統故障時:需要從是否是網路導致的故障的角度進行故障劃分,包括節點故障和網路故障,

而這兩類故障可能同時包括物理故障和軟體層故障。由於軟體層故障和具體的程式實現等相關,因此主要

由開發者根據自己的實現去解決;物理層故障的排查則需要仔細分析

物理故障:節點故障

節點故障有很多種,大體可以分為兩類:

1、硬體故障,比如機器硬碟損壞、記憶體接觸不良等;

2、軟體故障,比如由於請求過多,超過伺服器處理能力上限,導致無法處理,又或者是機器被攻擊,導致

機器癱瘓等。

表現:該節點機器無法為使用者提供服務。

物理故障:網路故障

網路故障:

網路故障就是分布式集群中,某些節點之間無法完成通訊。

原因有很多種:比如路由器故障、dns 故障、網路線路斷裂等。這些物理故障在軟體層的

部落格221 分布式中的事務

內容 記錄分布式中的事務 分布式事務種類 剛性事務 遵循 acid 原則,具有強一致性。比如,資料庫事務。柔性事務 其實就是根據不同的業務場景使用不同的方法實現最終一致性,也就是說我們可以根據業務的 特性做部分取捨,容忍一定時間內的資料不一致。分布式事務的acid理論 原子性 atomicity 即...

部落格220 分布式中的選舉方法

內容 簡單介紹一下分布式中的一些常見選舉方法 為什麼需要分布式選舉方法 為什麼要有分布式選舉?主節點 在乙個分布式集群中負責對其他節點的協調和管理,有了它,就可以保證其他節點的有序執行,以及資料庫集群中的寫入資料在每個節點上的一致性。一致性 資料在每個集群節點中都是一樣的 如果主故障了就需要從從結點...

分布式 2分布式事務

分布式 1概述cap和base 分布式 2分布式事務 分布式 3分布式一致性演算法 分布式 4集群 分布式 5服務限流演算法 分布式 6分布式id 分布式 7效能壓測 分布式 8日誌鏈路跟蹤 分布式 9分布式鎖 redis鎖的幾種實現 參考 分布式系統間各種問題 宕機 網路不穩定 本地事務無法滿足需...