某某銀行IT運維管理的三點和四化

2021-09-08 03:37:19 字數 3180 閱讀 7329

a銀行以

」服務至上、科技先行

」的原則,大力推動科技部門和資訊系統的建設,並注重強化運維體系建設,提公升系統服務水平,保證關鍵應用的可用性。

在a銀行科技部門強化運維體系建設的過程分中,a銀行運維中心總經理提出了a銀行it運維服務管理的三點和四化指導原則,積極的推動a銀行it服務管理從被動的基礎的it運維工作到主動的高階段的it服務管理。

做好運維的三個關鍵點就是監管檔案明確給以指引的:運維流程管理、監控及一體化管理、應急管理

加強運維流程管理。進一步完善運維管理流程,健全運維管理制度和標準,重點加強事件管理、問題管理、變更管理、配置管理等關鍵管理流程和資料管理、機房管理等制度標準建設與執行力。加強管理流程整合,完善資訊互動機制,形成閉環管理。強化事件分級制度,建立有效的事件公升級及響應機制;加強事件後續分析與處理,不斷優化管理流程;建立變更分類標準和變更分級審批流程,完善變更視窗管理制度,有效降低變更對生產執行的負面影響;制定配置引數移植、修改、備份、儲存、更新、銷毀等方面的管理制度,控制配置操作引發的風險。完善資料儲存、使用、傳輸以及備份管理,進一步制定標準、規範,重點強化客戶資訊和經營分析資料等敏感資料訪問控制、清理、銷毀以及資料變形使用管理;進一步加強機房人員、供電、空調、防火管理。

加大集中監控及一體化管理力度。健全生產系統軟硬體、網路及應用系統效能監測指標體系,優化監控策略;在實現對系統、裝置、網路、基礎環境等監控基礎上,重點加強對核心應用系統和電子銀行渠道監控;構建統一監控平台,統一管理和展現各種監控資源,實現集中告**式,全面、及時掌握系統整體執行狀態,快速定位故障、縮短處理時間;加大對總分行監控系統整合力度,提高總行對分行生產系統監管能力,進一步完善監控、響應、處理、報告、反饋和跟蹤機制,實現全行範圍基礎設施和主要應用系統生產運**況的全面監控,提高執行管理的全面控制能力。提高運維管理自動化水平,整合操作、維護、監控、響應、處理等管理流程,推進企業級總控中心(ecc)建設,促進運維管理一體化。

加強應急處置,提高協作能力。應急管理包括故障應急處理、高可用冗餘建設、災難恢復計畫drp或業務連續性計畫bcp等幾方面。

建立健全應對重大事件(突發事件)的預警、報告、決策、指揮、響應及退出等環節的應急處置機制。制定監測指標,實時監測業務執行狀態,及時發現異常情況,及時預警;建立清晰的報告流程,明確報告路線;建立應急指揮、決策體系,統籌協調,高效決策,保證指揮流程暢通;制定應急處置響應流程,加強關鍵崗位人員配置。

建立應急預案一體化管理體系,建立涵蓋總體預案、專項預案等預案框架;統籌預案管理,加強預案之間的銜接與配套;建立有效的預案維護機制,涵蓋預案制定、評審、發布、變更和**過程;制定預案編制規範,保證預案編制質量;強化預案後評價與持續改進機制,保證預案有效性。

根據風險戰略與業務連續性目標,制定災難備份體系建設策略與實施路線;以業務有效恢復為目標,逐步加強災備體系建設;逐步加大資料、系統、基礎設施等各類資源的保護範圍以及恢復能力;逐步推進分支機構災難備份建設,提高電子銀行渠道災難恢復能力,推進外聯交易、支付、清算等重要渠道災難備份建設。

探索災難備份體系建設模式,加強架構設計,應用技術創新,加強資料中心集約化、標準化、流程化管理;深入研究資料中心「雙活」、「多活」建設模式,提高資料中心之間相互備份、切換和接管能力。

同時銀行和e8合作把運維績效考核kpi及sla又融合進itil運維流程管理系統,達到以kpi引導,轉化被動的基礎的it運維工作到主動的高階段的it服務管理。

有了上面的三個關鍵點,做好運維的工作還需要「實現四化」:「合規化、透明化、標準化、系統化」。實現這個四化後,才會有更好的方法和更好的基礎去做好運維工作

1、

合規化從監管以及管理高層與風險管理迫切壓力需求的角度來說特別重要;內容是「做好資訊保安及應急管理」,需要管理流程與安全及應急管理控制手段結合,如itil變更審批流程與堡壘機許可權控制系統的結合。如itil事件公升級到重大事件,再公升級到災難等公升級流程及應急流程管理,包括災備恢復演練的流程。基於以上事例郭總認為「應急管理的一部分也是可以利用一些流程化管理實現的」 2

、系統化就是利用e8.it運維管理平台,這種it服務管理系統將各種it管理流程、運維管理經驗、it服務管理思想系統化,並能不斷優化,擴充套件。 3

、「透明化」就是運維的管理要對內對下透明,對上對外透明,則實現方法是」健全運維績效考核評價機制以及sla,服務級別協議與服務報告管理」這幾點。

「透明化」這一點其中有一點奧妙。銀行郭總指出,指標只是其中表象的一部分,關鍵是如何融合進工作流程中,讓每個人都知道kpi,並實時了解掌握自己的當前績效,真正發揮出的kpi導向作用:好用、易用、有用。做好從時效、質量、滿意度等考慮的事件、問題、變更管理的基礎工作,包括以sla、系統可用率考核的重大事件或故障、系統容量、效能管理等工作,做好基礎、介面與系統化,才能將 「透明化」有了實現的基礎,能使得運維部門有壓力和動力從it運維 轉向做it服務管理,變被動運維向主動服務轉變,然後從對內、對下的透明化,轉向sla做到對外、對上的透明化。 4

、」標準化」

a銀行以銀監會的監管要求為基準並結合it服務管理的最佳實踐itil制定本行的it服務管理標準。 a

銀行資訊科技部運維中心根據it服務管理的三點和四化指導原則,積極推進it運維服務管理平台的建設並於2012月3月份上線了深圳非凡公司的e8.itsm系統,把it服務管理的理念和最佳實踐融合進it運維服務管理平台,真正的推動a銀行的it運維管理轉變為it服務管理。

e8.itsm

是一款比較成熟的本土it服務管理平台,產品開發公司為深圳市非凡資訊科技****,它包括圖形化的、具有中國特色的流程管理平台和it運維管理平台兩部分。其中it運維管理平台包括了運維流程管理、監控及一體化管理平台、應急管理等功能。

產品方面:非凡公司秉承著做最適合中國企業應用的itsm產品的理念,圍繞itil規範,結合國內企業管理文化,構建以「客戶為中心,流程為導向,生命週期管理」的it運營模式。e8.itsm據有itil核心最佳實踐管理工具和工作流程,簡潔易用;大集中的it(應用、系統、硬體、網路)配置庫和知識庫; 超越itil的it綜合管理流程;簡單高效的e8.net工作流二次開發平台。

經驗方面:非凡公司具有多家大中型企業和銀行的實施經驗;本著對客戶負責的原則,非凡公司實施方法採用顧問加產品的方法幫助企業建立it運維管理體系、規範各崗位職責和流程,把it運維管理的最佳實踐和企業的實際相結合提公升企業的it服務管理水平。

運維資料之運維的痛點和思路

1 故障的發現 2 故障的止損 3 故障的修復 4 故障的規避 1 發生了什麼 2 怎麼解決 3 多長時間能解決。由人力來回答這些問題效率低 不準確 不及時。因為我們要對付的這個系統實在是太複雜了。aiops提高運維生產力的一種方式就是把處理突發故障時的人力分析盡可能的都替換成機器來做。我們現在有非...

機房伺服器維保的三點內容

在機房眾多裝置中,伺服器是重中之重,伺服器上存放有很多資料,對裝置執行也起著重要作用。所以企業對機房的穩定性 安全性要求極高。一旦伺服器出了故障,對企業造成的經濟損失將不可估量。下面介紹三點伺服器維護的內容,能夠防止伺服器突然出故障。機房裝置 開機順序 一般地說,系統開關機應嚴格遵循以下步驟 開啟總...

IT運維管理和傳統的網路管理的區別

在過去的日子裡,跟大家聊過關於it運維管理的概念 物件 以及it運維管理解決的問題和主要的任務。事實上跟大家討論了很多關於it運維管理的基礎理論,也許有些朋友會有疑問,it運維管理和傳統的網路管理到底有什麼區別呢?我們通過對實際案例來分析,看it運維管理和傳統的網路管理具體有哪些區別。某客戶網路規模...