有獎徵文 IT運維之道 運維的標準化與安全

2021-09-05 05:14:31 字數 2742 閱讀 8195

運維一般是指對已經建立好的it系統的維護,包括網路、系統、中介軟體、資料庫等方面。所謂it運維管理,是指企事業單位或公司的it 部門採用相關的方法、手段、技術、制度、流程和文件等,對it 執行環境(如軟硬體、網路、系統、資料庫等)、it 業務系統和 it 運維人員進行的綜合管理。

隨著it的發展、資訊化程序的推進,運維管理將覆蓋對整個組織執行,進行支援的管理資訊系統並涵蓋it相關的所有內容,除了傳統的it運維,還拓展了業務運維和日常管理運維。其參與的物件也從it部門和人員,拓展到組織的管理層和各部門,及其相關的業務骨幹。

it運維是it管理的核心和重點部分,也是內容最多、最繁雜的部分,乙個企業或公司在不斷發展壯大的過程中,it系統也隨之不斷成熟和完善。從幾十台到上百臺、上千臺伺服器,每天出現故障的機率和突發故障都會增大很多,運維不是被動的救火隊和敢死隊,相反it運維的方式方法也需要不斷變化以適應日趨龐大複雜的it系統,運維的標準化、自動化、安全高效也呼之欲出,成為一種趨勢和發展的方向。那麼如何去實現運維的標準化、自動化和安全高效呢?

首先,運維需要流程。大多數時候,運維人員都在進行著簡單重複的工作,且很難得到終端使用者的肯定。曾有乙個詞「窮忙族」形容運維工程師,工位上不見人影,一坐下**不斷,是不是你該解決的問題都有人來找你。這樣的場景,大家應該都有體會。標準化流程的制定非常重要,不僅方便問題的梳理而且能讓對應的問題找到對應的人,同時有利於團隊的協作。運維的流程化管理需要把握兩個原則:

1、設立it運維關鍵流程,引入優先處理原則

設立it運維關鍵流程,引入優先處理原則就是要定義出it運維的每個關鍵流程,不僅僅是定義流程是什麼,還包括要指出每個關鍵流程對企業有什麼影響和意義。同時,在設定運維流程時還需要引入優先處理原則,例行的事按常規處理,重大特殊事件要按優先順序次序處理,也就是把事件細分為例行事件和例外關鍵事件。

2、建立規範的事件跟蹤流程,強化運維執行力度

結合本公司it系統的情況,建立故障和事件處理跟蹤流程,利用**等工具來記錄故障及其處理情況,以建立運維日誌,並定期回顧從中辨識和發現問題的線索和根源。事實上大量運維實踐也證明,建立每種事件的規範化處理和跟蹤指南,可以減少it運維操作的隨意性和強化運維的執行力度,在很大程度上可降低故障發生的概率。同時,使用者還可以通過規範的流程隨時追蹤該故障請求的處理狀態。

其次,運維需要標準化、自動化。在運維工作中,大家遇到最多的無非就是故障處理、系統公升級、上線、安全加固等問題,問題如何及時發現、處理、反饋,系統公升級、上線如何自動平滑的進行,安全加固如何穩妥規範的進行,這些都需要乙個標準,有了標準才會自動和銜接。同時隨著it運維管理工作的複雜度和難度的大大增加,僅靠過去幾個「運維英雄」或「技術大拿」來包打天下已經行不通了,企業需要運用專業化、標準化和流程化的手段,來實現運維工作的自動化管理。

舉例來說,所有it裝置在遇到問題時要能自動報警,無論是系統自動報警還是使用人員報的故障,應以紅色標識顯示在運維監控器的螢幕上並有相應的警示音,然後it運維人員只需要按照相關知識庫的資料,一步一步操作就可以。因此,企業需要事先建立自動工單式流程管理,當裝置或軟體發生異常或超出預警指標時會觸發相關的事件,同時觸發相關工單處理流程給相關it運維人員。it運維人員必須在指定時間內完成流程所規定的環節與工作,以提高it運維響應問題的效率。事後按時間階段性對事故型別進行統計和分類,分析故障發生的頻率,以提供日後運維重點和決策的依據。同時it運維的自動化還能夠**故障、在故障發生前進行報警,讓it運維人員把故障消除在發生前,將所產生損失減到最低。

對於企業來說,運維的自動化主要體現在兩個方面:一是it運維監控和診斷優化;二是運維流程自動化管理。it運維監控的自動化,就是對重要的it裝置實施主動式監控,如路由器、交換機、防火牆、伺服器等。其二就是要做到配置變更檢測的自動化,當it裝置配置引數發生變化,將觸發乙個變更流程轉給相關技術人員進行確認,通過自動檢測協助it運維人員發現和維護配置,並能夠根據相應的環境進行優化。

運維流程自動化管理主要就是要實現

維護事件提醒自動化,通過對it裝置和應用活動的實時監控,當發生異常事件時系統自動啟動報警和響應機制,第一時間通知相關責任人。其二就是系統健康檢測自動化,定期自動地對it裝置硬體和應用系統進行健康巡檢,定期自動的對系統做日誌的收集分析,記錄系統執行狀況,並通過運維人員階段性的監控、分析和總結,生成it運維的可用性、效能、系統資源利用狀況分析報告。

附上一張運維規範作業電子記錄單

最後,運維需要安全,只有安全才能實現高效穩定。

針對軟硬體、資料、文件等,做好相應的安全措施,具體需要注意的是:

1、伺服器和網路裝置等密碼一定要符合相應的複雜度。

2、遠端連線時,應設定成普通賬戶登入然後才能切換到root或管理員級別進行操作。

3、對賬戶嚴格分級許可權控制,並設定好審計等。

4、防止惡意註冊,手機、郵箱驗證註冊或驗證碼,並限制每個ip註冊的數量。

5、需要從資料庫中提取或者存入資料,連線資料庫時,注意完成相應操作後及時關閉資料庫連線。

6、對資料庫深入防禦。保護資料庫的措施越多,***者就越難獲得和使用資料庫內的資訊。比如:敏感關鍵資訊加密儲存、避免使用預設埠、對資料庫的連線進行ip限制、審計追蹤控制等。

7、重要、關鍵資料的定期及時備份儲存,並對備份的壓縮包進行加密。  

而對於企業管理人員來說,需要注意的:

1、完善安全制度並加強安全制度的落實。

2、加強人員的安全教育和管理,避免人為因素或防控不嚴而洩露。

3、加大對安全的投入和支援企業資訊化安全建設。

4、**發布的任何資訊進行嚴格內容審查,對非法***賬戶發布的違法資訊一經發現,即刻報案並取證追查源頭。

it運維是個不斷發展和完善的過程,隨著科技的前進,it運維標準化和安全也在不斷發展和變化,我們仍要保持一顆好奇、學習的心,去探索和分享,同時也希望更多的朋友分享你的心得和體會。

運維之道 RPM

一 rpm工具簡介 rpm是 redhat package manager 的縮寫,根據名字也能猜到這是redhat公司開發出來的。rpm 是以一種資料庫記錄的方式來將你所需要的套件安裝到你的linux 主機的一套管理程式。也就是說,你的linux系統中存在著乙個關於rpm的資料庫,它記錄了安裝的包...

有獎徵文 越幹越有意思的運維

越幹越有意思的運維 我第一在意的可能就是安全了,因為以前幹過一陳子的安全,而且我這三周基本上就是撲在乙個安全事故上面,被植入後門到最後伺服器淪陷同樣被植入後門以後 沾滯鍵等,網馬所有靜態檔案基本上被掛了網馬。160w的靜態檔案那是相當的痛苦。過程就不說了。安全和運維有啥關係,安全應該是開發的?或者應...

python運維課程標準 Python運維初級課程

隨著資訊時代的持續發展,it 運維已經成為 it 服務內涵中重要的組成部分。面對越來越複雜的業務以及日趨多樣化的使用者需求,不斷擴充套件的 it 應用需要合理的 it 運維保障 it 服務靈活便捷 安全穩定。從初 期個位數伺服器發展到龐大的資料中心,僅依靠人工已經無法滿足在技術 業務 管理等方面的要...