資料中心服務保障五原則

2021-09-23 07:08:45 字數 2123 閱讀 3474

資料中心承載著大量的應用業務,每逢重大節日或者訪問洪峰的到來都需要做各種保障,以防出現突發事件,對應用造成影響。比如:網際網路電商的雙11大**,高中考**的報名,apec等重要事件等等,這些事件有的是時間節點特別重要,盡量不要出問題,有的是訪問資料中心流量壓力特別大,盡量不要出問題。所以一年時間下來,資料中心需要保障的大大小小事件的確不少,而且每次服務保障任務側重點也有不同,如何做好這些保障工作,考驗著資料中心的運維服務能力水平。本文著重介紹做資料中心服務保障工作需要依據五個原則,下面將逐條講述一些原則,通過這些原則將服務保障工作做好。

首先,資料中心要對每次需要保障的業務弄得清清楚楚,抓住痛點,解決痛點。如果是大型的節假日,這時考驗的是資料中心整體業務的穩定性,尤其是節假日哪些應用訪問量會增大,要提前做預案,根據往年積累的經驗積極應對。如果往年系統出現了這樣那樣的問題,一定在這次的服務保障之前消除掉隱患。如果是電商**,就要關注集中時間內訪問使用者的數量,模擬大規模數量的訪問使用者,看系統是否可以承受,這時就要關注計算、頻寬這些資源是否足夠,可能不足的地方要及時補全。乙個資料中心可能承載了數百個甚至上千各種應用,要明確哪些是需要服務故障的,哪些是重要的,哪些是次要的,應用的重要性要有分級。在不同的活動中,不同的應用重要性是有變化的,要及時進行調整,將重要力量投入到關鍵節點的保障上來。

其次,資料中心的設計和運維的人員要坐到一起,共同討論保障事宜。業務運維的人要深入理解資料中心的系統架構,從全域性的視角去對待服務保障工作。資料中心的規模和應用有大有小,投入上必要有差異。如果乙個資料中心僅有數十台的伺服器和小型網路裝置,沒有必要對整體服務保障大動干戈,準備一些備用埠和裝置,萬一關鍵時刻出了問題,及時恢復業務就可以了,不需要將過多的資源和精力投入到服務保障上來。資料中心做服務保障也要綜合考慮,資金和人力也是需要衡量的重要方便,要用最少的投入得到最好的效果。掌握整體架構,對服務保障非常重要,避免各種應急方案在關鍵時刻失效,要盡可能將可能的突發情況考慮完全。資料中心要建立實時的監控體系,建設服務依賴的降級系統,建設具有冗餘能力的架構體系,從整體架構層面做服務保障,這樣可以避免將精力投入到某個特定環節中,而忽略了整體,而且架構層面一定具有冗餘性,以便在出現突發情況時,有備份方案可選,將應用切割到備用系統上來,避免出現應用中斷的情況。如果在服務保障期間,仍出現了較嚴重的應用中斷事件,那服務保障工作就是徹底的失敗。

第三,要豐富服務保障工具,現在的資料中心應用業務越來越複雜,簡單地靠ping、tracert等命令有時也很難判斷問題,尤其是應用層面的問題,所以有必要引入一些排查和監控的工具。正所謂「巧婦難為無公尺之炊」,工欲做其事,必先利其器,手上需要有一些獨門「暗器」,在關鍵時候能發揮效用。現在工具已經從純手工,經歷工具化、系統化,直至容器化和彈性排程上,什麼scribe、wtool等免費監控的管理工具都可以派上用場,要善於使用這些工具,通過這些工具對資料中心執行各種資料引數進行分析,服務保障才更有效。

第四,要關注新技術。每一次的服務保障都是發現資料中心隱患和弱點的最好時機,有時甚至要在服務保障之前做演練,以便能提前暴露隱患,及時進行糾正。當遇到一些困難時,要看是否有些新技術可以很好解決。現在資料中心的技術更新換代很快,這些新技術都是應對資料中心發展過程中遇到的新情況,當自己的資料中心也遇到這些問題時不妨考慮引入一些新技術解決問題。資料中心是當今資訊科技發展的寫照,不能墨守陳規,需改變的時候就是要做出改變。引進新的技術,不僅讓自己的資料中心有耳目一新的感覺,也可以提公升資料中心的應用處理能力。當然,引入這些新技術時也要保留謹慎,特別新的不成熟的技術要充分考慮引入風險,是否適得其反。在引入新技術的道路上,不能一下子步子邁得太大,要小碎步地快速向前跑,最終利用新技術的優勢解決資料中心面臨的各種問題。

最後,資料中心要做服務保障需要投入大量人力,有時單靠資料中心自己有些力不從心,畢竟有很多系統和裝置都不是資料中心運維的人員所能掌握的,這時可以按照事情的重要性,請一些專門提供第三方服務的專業公司人員來資料中心做服務保障。這些服務公司有著豐富的服務保障經驗,將任務交由這些公司來做,花錢省心,而且萬一出了什麼差錯,還可以獲得一些補償。資料中心還可以將系統或裝置廠商的人請來做服務保障,資料中心每年採購大量的裝置,有時還會購買原廠人員服務,這些在服務保障時都可以用上。所做這些雖然投入的資金和人力會多一些,但在應對突發事情的處理能力上將大為提高。資料中心應該將各種內外部資源都充分利用上,做好服務保障工作。

以上介紹的是資料中心服務保障的五個原則,依據這五個原則指導服務保障的實際工作,將大大提公升服務保障的質量。資料中心上的應用在特定時段特別重要,關鍵時刻不能掉鍊子,必須依仗這五個原則,切實做好服務保障工作。

資料中心服務優化將成為資料中心管理的前沿技術

如今,越來越多的資料中心運營商部署資料中心基礎設施管理 dcim 軟體,這不僅幫助他們有效監控關鍵的基礎設施,鞏固其資料中心的市場地位,同時也有助於優化資料中心服務。但企業廣泛採用dcim任重道遠。一些企業正在使用一種新的資料中心管理軟體,超越了dcim管理基礎設施的能力,可以獲得更高的效率,敏捷性...

DevOps監控微服務的五原則

我們對微服務的需求可以歸納為乙個詞 速度。這種更快提供功能完善且可靠的軟體的需求,徹底改變了軟體開發模式。毫無疑問,這個改變對軟體管理,包括系統監控的方式,都產生了影響。在這篇文章裡,我們將重點關注放在有效地監控產品環境中的微服務所需做出的主要改變。我們將為這一新的軟體架構擬定 5 條指導性原則來調...

資料中心伺服器大戰 思科vs惠普vsIBMvs戴爾

思科去過一直被視為一家純粹的網路公司。在企業和服務提供商網路中,以及在路由器和交換機市場上,思科都佔據著統治地位,擁有舉足輕重的影響力。惠普曾經是思科的長期合作夥伴。在合作中,惠普負責在銷售自己的資料中心伺服器 儲存 企業pc和印表機的同時轉售思科的路由器和交換機。戴爾也是如此,不過其合作程度小於惠...