運維的本質是什麼?

2021-09-23 06:37:50 字數 1336 閱讀 7198

五一的時候看到的乙個微博,infoq發表一篇文章說運維的本質是「視覺化」,這個觀點不知道出自**,但是非常的可笑。

很多觀點都是出自沒有實際經驗的人,這是技術界的悲哀。作為乙個從事多年一線運維的普通工程師,我常常給新來的同學講,什麼是運維最本質的東西?

很簡單,運維的本質是「可控」。運維是一門非常複雜的學問,不像學會兩三門語言,設計幾個**應用就可以成為架構師那樣的工作。他除了技術之外,經驗積累、視野、大局觀、甚至是心胸都有可能決定成敗。優秀的開發者比比皆是,但是優秀的運維人員少之又少。

原因就是運維內容太複雜了!而我為什麼說運維的本質是「可控」,大概有以下幾個原因:

第一點:穩定性「可控」

運維不是維護一兩台機器,發布**就好,而是要做成千上萬,甚至十幾萬臺的伺服器和各種網路裝置、儲存裝置等專有裝置維護,這些伺服器包含webserver,db,cache,cdn,computing多種型別,如何讓這些大量的伺服器穩定的跑在生產環境中,不因為硬體損壞、發布變更、系統公升級而引發的業務系統故障。沒有東西是不會壞的,沒有系統是沒有bug的。硬體要壞,系統公升級,發布變更,這些都沒有關係,但是最重要的,一旦發生這些之後,運維人員知道,這會業務影響多大!?需要多少時間和工作量恢復?

第二點:效能「可控」

我和dba一起維護db多年,dba最痛苦的地方,不在於「慢」,而在於時快時慢。乙個不穩定的效能,就無法預估承受業務壓力需要的系統規模,這樣對於dba在維護是無異於自殺。很多雲計算廠商做設計的時候,往往也會忽略這一點,其實效能的問題,比最高效能,來的重要的多!非常漂亮的數字不能解決問題,但是一次效能的不足,可能就引發故障。

第三點:安全「可控」

有沒有絕對的安全呢?理論上沒有,所以,運維的同學,總要花很多精力在系統安全上,比如控制哪些使用者可以登入系統環境?哪些使用者是可以進行變更?哪些使用者甚至可以拿到最高許可權?測試和開發隔離,公司內外隔離,都是因此而生。只要能夠控制許可權的面積,範圍,就能知道風險,這邊是所謂的安全「可控」。

重要如上所示,但是正如一開頭所說,運維的內容相當複雜,交付「可控」,變更內容「可控」,效率「可控」都是可以值得深究的東西,因此,無論是「視覺化」,「大資料」,「運維自動化」等等,都是在為「運維可控」服務的。資料視覺化,帶來的是規模可控;運維自動化,帶來的是效率可控,風險可控,如是而已。

每乙個點的提公升,都是運維的提公升,希望所有從事運維的同學,都能感受到,做什麼可以讓「可控力」提公升,不要再半夜的時候處理故障,不要和女朋友看電影的時候回公司處理故障,也許我們再次遇到這些問題的時候,可以拿起一杯茶,做乙個優雅的運維。

運維是什麼???

網際網路運維工作,以服務為中心,以穩定 安全 高效為三個基本點,確保公司的網際網路業務能夠 7 24 小時為使用者提供高質量的服務。運維人員對公司網際網路業務所依賴的基礎設施 基礎服務 線上業務進行穩定性加強,進行日常巡檢發現服務可能存在的隱患,對整體架構進行優化以遮蔽常見的執行故障,多資料中接入提...

Linux運維是什麼?linux運維的基礎知識

如果您對運維行業了解一些,應該會知道,現在的運維早已不是早年的 睡機房 往辦公室打眼一看,分不清是運維攻城獅還是開發程式猿,但是,運維這行也是春天到了,今天linux,明天雲計算的,各種新鮮概念層出不窮,那麼,linux運維是什麼?雲計算運維又是什麼?linux運維需要掌握的基礎知識 1 shell...

雲運維的關鍵是什麼?

隨著雲時代的到來,越來越多的企業和機構將關鍵業務放在雲端執行,如何做好雲運維是it部門面臨的乙個新的挑戰。做好雲運維,首先要明白雲運維和傳統運維的不同,傳統運維是以伺服器為中心的運維模式 而雲運維是一種以應用程式為中心的運維模式。而以應用程式為中心就是做好雲運維的關鍵!以應用程式為中心是關鍵 雲時代...