從0到1 滴滴DB自動化運維實踐了解一下

2021-08-19 23:01:20 字數 873 閱讀 3439

一般來說,自動化運維都會根據自己原有的架構來設計自動化運維平台,上圖是滴滴db的架構圖,最上面是tgw lvs,也就是大家所熟悉的vip,接下來是**層dbproxy。**層下面是mysql的主從關係,一般情況是一主、一備主和乙個從庫,如果讀取操作多,qps會比較高,從庫也需相應的增多。

同時還要有mysql高可用的監控來應對主庫掛了等等的異常情況。運維監控,我們是使用最常見的zabbix來做的。除此之外,我們還做了備份模組和效能優化的模組。

dbproxy相當於乙個入口,連線應用,它是分布式的,因此每台上都會有自己的原始配置,所有的訪問db的流量都要經過dbproxy層,dbproxy會記錄正常的訪問日誌,還有一些錯誤日誌,例如沒有加白名單或者是sql語法錯誤等等都會在dbproxy層攔截,產生錯誤日誌。

我有幾張阿里雲幸運券分享給你,用券購買或者公升級阿里雲相應產品會有特惠驚喜哦!把想要買的產品的幸運券都領走吧!快下手,馬上就要搶光了。

上圖的架構就是我們在做自動化運維的初始部署,我們希望能夠完成從業務申請到部署完成的一系列連貫動作。

我們平時的工作內容如上圖所示,基本包括部署、工單處理、擴容拆分、監控報警處理以及其它任務。

一周時間,rd申請30—50個例項在我們的工作中是很常見的,這時如果沒有自動化運維,單純靠自己手工部署的話,是很消耗時間的;工單處理的工作內容基本就是做一些ddl、表結構的變更,白名單以及其它需求;隨著業務的發展,資料量會猛增,由於單機磁碟的儲存是有限的,這時我們就要思考擴容、拆分的問題了,還有一種情況是磁碟可能足夠儲存,但是你的tps/qps單機可能撐不住,這時也要去做擴容;監控報警處理指的是我們前面提到的sql錯誤,白名單沒有加以及其它一些報警。

其中,部署和工單處理是我們日常工作的重頭,其佔比大約為70%。但是這一部分工作很容易自動化,一旦實現自動化,我們的工作強度會大大降低。

讀書1 從0到1

總結你身邊是不是總有這樣的人,他特立獨行,有的時候厭煩規則,顯得與眾不同。如果有,請盯住他們,本書就以這類人為論述,作者對他們的迷戀堪稱瘋狂。最近看的一場電影 綠皮書 其中的唐雪莉和托尼就是這樣的人,托尼改掉歧視黑人的行為,甚至為黑人唐打工,而唐也與其他黑人格格不入,他特立獨行,不了解黑人 他是鋼琴...

需求從0到1

軟體是一種工具,是用來輔助人們解決某些問題的 相關的問題,組成問題領域 因此解決問題是軟體存在的價值,所以軟體的價值是符合某個問題領域的需求,從問題領域出發找構建軟體系統的重要性由此而得。充分了解問題領域,能夠幫助你理解需求 涉眾分析報告 通過以上大類,對專案範圍的社眾進行調查和訪談,書寫成涉眾報告...

《從0到1》雜感

從0到1 最近非常火,到處都在談論這本書。書中討論了很多問題,幾乎涵蓋了乙個初創企業要面對的方方面面。個人印象最深刻的,是書中對 壟斷企業 的描述。彼得.蒂爾給出了壟斷企業的四大特徵 專利技術 網路效應 規模經濟 品牌優勢。專利技術。專利技術是公司的核心優勢,很難被其他公司抄襲,最好領先行業平均水平...