浙江移動完成國內最大規模的Oracle資料庫公升級

2021-06-18 00:15:07 字數 3021 閱讀 5308

本事件引發的itpub討論帖(可以看見很多大師回帖):

【techtarget中國原創】

編者按:近日,浙江移動進行了核心系統資料庫的公升級工作,這一專案是迄今國內規模最大的單次核心系統公升級。專案成功完成之後,techtarget中國特約記者在現場採訪了移動公司的主要專案負責領導,為大家揭秘這次規模龐大的系統公升級工作。

2013 年8月7日,中國行動通訊集團浙江****的乙份業務通告宣告了一次重大的技術工程即將開始,通告稱"為了向您提供更好的服務,我公司將於 8月10日下午17:30至8月11日早上8:00對系統進行公升級"。這次公升級影響的範圍極廣,公升級期間將"停止全省全部業務的受理、提醒、話費充值和查 詢"。

浙江移動資料庫公升級業務通告

通告雖簡單,但背後卻有乙個108人組成的團隊進行維護支援,浙江移動業務支撐中心公升級專案總指揮王曉徵將其戲稱為"108將"。經甲骨文公司確認,這是目前國內最大規模的單次資料庫公升級操作,並很有可能也是全球規模最大的一次。這次眾多廠商、專家雲集的三墩公升級專案, 可能在多年之後仍然會被大家津津樂道。

為何選擇這個時機進行公升級?

據了解,本次浙江移動的資料庫公升級專案是從oracle 10g

公升級到oracle 11g

版本。對此王曉徵表示,浙江移動的oracle 10g版本已經使用了近5年的時間。近期甲骨文公司也已經結束了對該版本的擴充套件支援,這也就意味著甲骨文將不再為該版本提供補丁修正,這一版本的歷史使命已經結束。

而在2023年發布的oracle 11g版本經過多年的使用者驗證,已經足夠成熟穩定,並且其中的很多新特性能夠為浙江移動帶來新的技術增值,如active dataguard

技術能夠在容災備庫上同時支援活動查詢,這不僅可以讓備用庫承擔報表查詢等業務負載,也可以充分利用原本空閒的備庫資源,既改善業務使用,又可以提公升資源利用。技術更新與價值創造,是浙江移動選擇公升級的源動力。

超級團隊+多方協作 資料庫公升級順利完成

本次公升級的專案經理郭岳(@正牌三少

)為我們介紹了支援團隊的構成:"公升級工作到場共有108人,其中現場dba 20人左右,因為同時進行了一次新業務上線,所以還有幾十人的開發測試、幾十人的應用維護團隊,此外還有網路、儲存、主機等等的保障人員。 "

如何協調這一龐大的支援團隊進行短時間的高效協作,對於專案管理來說也是乙個挑戰,dba出身的郭岳作為專案經理以精確到分鐘的專案規劃出色的完成了他的職責。

據 了解,浙江移動在如此大規模的資料庫公升級操作中,還要同時進行了新業務的上線公升級。對此王曉徵表示,浙江移動技術部已經對灰度發布和平滑公升級做了多年的嘗 試和實踐,取得了顯著的成果和積累了豐富的經驗。很多企業視資料庫公升級為洪水猛獸,這往往是因為他們對技術的認知和把握不足,吃過公升級之後效能和故障的苦 頭,而浙江移動已經對應用的各層面進行了詳細的分層和元件化,釐定了技術層次、控制了影響範疇。在清晰把握了各個元件層面的界限和影響之後,我們能夠從容 的進行公升級和維護工作,包括資料庫和應用,這些層面的公升級和發布沒有任何不同,不應該有任何乙個元件或環節成為推動業務演進的障礙和瓶頸。

本次公升級操作的部分支援專家

根據techtarget中國對dba的一項調查

顯 示,最令dba頭痛的一項工作就是資料庫公升級。而面對超大規模的資料庫公升級時,充分的前期準備是必不可少的。王曉徵對記者說:"在戰略層面上,我們弱化了 資料庫公升級的重要性,但是在戰術上我們非常重視本次公升級工作。唯有充分準備,才能舉重若輕,大家可以看到我們最終執行公升級的夜晚,只需按照之前測試的步驟 按部就班的執行即可。"

王曉徵透露:"為了充分進行公升級準備和測試,以及公升級之後的重 點保障階段,我們準備了充足的後備資源,除了原廠資源外,我們還邀請到雲和恩墨的專家團隊到達現場保駕護航,形成了以原廠商和第三方專家相結合的技術支 撐。有了這些準備之後,這次的公升級工作就基本排除了出現意外的可能性。"

據郭岳介紹,本次oracle資料庫的公升級過程僅耗時3個半小時,剩下的就是應用的發布與測試。

規模創紀錄:7套rac資料庫同時公升級

此次浙江移動的資料庫公升級工作是迄今為止規模最大的一次。對此郭岳介紹說,本次專案對7套rac架構的資料庫

同 時進行了公升級,這些資料庫承載了浙江移動5000多萬終端使用者的核心crm系統。其資料量規模、業務規模以及資料庫同時公升級規模經確認已經是目前國內最大 的。很多企業公升級時都是通過漸進的方式來完成的,而浙江移動經過充分準備後,完成了一次性應對大規模的集中公升級工作,事實也證明這次決策是正確的。

資料庫公升級成功經驗分享

在對本次集中資料庫公升級專案的評估中,總指揮王曉徵用到了"完美"這一詞:整個資料庫公升級過程中沒有出現任何異常,完全按照既定的步驟進行操作。公升級完成之後,經過8月11日和12日兩天業務執行的考驗,整體業務執行非常平穩。可以說浙江移動此次資料庫公升級實現了"無縫、透明",在對前端無影響的前提下,精確完成後端資料庫的大版本公升級,接下來就是好好應用oracle 11g的過程了。

在 本次資料庫公升級工作中,除oracle原廠之外,浙江移動還引入了第三方資料庫服務商。王曉徵表示,在企業服務中,原廠商和第三方服務商有著各自不同的定 位和使命,對於甲方,只要能夠定義清楚各家的職責和優勢所在,就能夠為自身找到更好的保障模式。浙江移動除了在技術管理上持續創新,也不斷在服務模式上進 行創新,目前國內優秀的服務商已經具備了高階服務的提供能力,這些企業的技術專家能夠更好地服務國內企業,在國家大力提倡軟體國產化、服務國內化的形勢 下,引入新的競爭關係對於企業是一件好事。

資料庫公升級成功後團隊合影

在總結本次規模龐大的資料庫公升級經驗時,王曉徵給出了八個字:"知己知彼,有備無患"。知己知彼的意思是說,作為甲方要清楚的了解自己的優勢與劣勢,也要清 楚的了解不同**商的能力與積累,明確各自的職責與界限,這樣互相配合才能精誠合作,一戰功成;有備無患是說,即便做好了充足的準備,在關鍵時刻,也要盡 量調集各種資源備用,這樣在出現異常突發事件時,也才能做到快速響應,影響最小化。

王曉徵表示:"就如同這次公升級操作,我們調集了雲和恩墨

最強的技術團隊,但是我希望不會用到他們出手。事實也確實如此,但是做好充分準備永遠不會錯。"

檢視和設定oracle資料庫的最大連線數

當前的連線數 select count from v process 設定的最大連線數 預設值為150 select value from v parameter where name processes 修改最大連線數 alter system set processes 300 scope sp...

檢視和設定oracle資料庫的最大連線數

當前的連線數 select count from v process 設定的最大連線數 預設值為150 select value from v parameter where name processes 修改最大連線數 alter system set processes 300 scope sp...

檢視oracle資料庫允許的最大連線數和當前連線數

在檢視資料的連線情況很有用,寫完程式一邊測試 一邊檢視資料庫連線的釋放情況有助於分析優化出乙個健壯的系統程式來。1 檢視當前的資料庫連線數 select count from v process 當前的資料庫連線數 2 資料庫允許的最大連線數 select value from v paramete...