運維平台系列 關於DevOps平台架構思考

2021-08-04 20:09:01 字數 697 閱讀 7802

現在很多公司都在推行devops平台。為了能夠提公升研發運維效率。這一章節主要寫點關於偏ops層面的東西,dev層面的東西主要涉及到研發域的內容包括**管理、**編譯與發布管理、研發流程專案管理及bug管理等。

乙個大的產品與技術架構圖:

後續會將各個子產品域的設計大圖整理出來.

1. 關於決策層的思考

基於運維規則 + 基礎資料(包括應用的元資料 + 離線大資料分析的結果**)+ 演算法分析 + 機器學習 => 推導出乙個最佳決策指令。(1. 關於自主決策)

決策層需要考慮全域性鎖問題。比如對某個應用進行了擴容機器操作,那另外乙個流程就不應該被執行。(2. 關於全域性鎖機制)

當觸發層發現了異常資訊(異常事件、異常監控資訊)只是乙個動作,真正是否會執行還是取決於決策層。所以決策這層後面要做很多離線計算分析。對元資料與規則進行定義就顯的非常關鍵了。

我覺得這套系統裡面最核心的應該是

1、資料層(需要提供各種維度的資料、離線與實時資料、歷史版本**資料)

2、決策層(如何做出準確合理的決策來代替人)

其他都是幹活層。比如執行器更多的是通過流程編排把各個運維節點串聯起來執行。觸發層也是定時採集機器上面的資料並計算乙個閥值。

資料層裡面最核心的乙個功能就是如何度量彈性排程的效果。

DevOps之運維平台構建

如今很多人認為devops將徹底取代傳統運維,我不這麼認為,在我看來devops只是很大程度上的代替了傳統運維的手工操作,運維人員只需寫好自動化運維指令碼,利用自動化工具 zabbix,elk,ansible等 就可以實現自動發布和監控,省去了很多人力。因此devops能否順利落地,運維平台的建設將...

實戰 阿里巴巴 DevOps 轉型後的運維平台建設

摘要 阿里巴巴devops轉型之後,運維平台是如何建設的?阿里巴巴高階技術專家陳喻結合運維自身的理解,業務場景的分析和業界方 的一些思考,得出來一些最佳實踐分享給大家。前言 我是這個應用的 owner 是阿里巴巴devops轉型的重要策略,運維有了這個策略以後,pe大量的日常工作就可以釋放出來,會有...

運維平台系列 關於彈性擴縮容操作的細節

在iaas層資源的自動擴縮可以有效地節省機器資源成本,比如在業務的低谷期可以將機器資源降下來,在業務高峰期可以自動擴容出來新機器。要支撐這樣彈性調配需要有幾個事情先要支援。1.基礎運維能力 即乙個應用的上線 下線可以做到全自動。以原子化服務的方式提供出來。比如輸入某個應用名稱 要擴容的機器數就會自動...