什麼是伺服器集群

2021-06-06 11:47:29 字數 3421 閱讀 8984

伺服器集群就是指將很多伺服器集中起來一起進行同一種服務,在客戶端看來就象是只有乙個伺服器 集群可以利用多個計算機進行平行計算從而獲得很高的計算速度,也可以用多個計算機做備份,從而使得任何乙個機器壞了整個系統還是能正常執行

一旦在伺服器上安裝並執行了群集服務,該伺服器即可加入群集。群集化操作可以減少單點故障數量,並且實現了群集化資源的高可用性。下述各節簡要介紹了群集建立和群集操作中的節點行為。

注意:有關安裝群集伺服器的資訊,請參閱 windows server 2003 產品家族的幫助和部署指南。

在伺服器群集產品中含有用來在伺服器上安裝群集軟體和建立新群集的群集安裝實用工具。建立新群集時,首先在選擇作為群集的第乙個成員的計算機上執行該實用工具。第一步是確定群集名稱並建立群集資料庫和初始的群集成員列表來定義新群集。 windows server 2003 群集新增了乙個群集管理設定嚮導以及使用 cluster.exe 命令列介面建立( 包括從遠端建立 )群集的功能。

建立群集的第二步是,新增可供所有群集成員使用的共用資料儲存裝置。這樣,建立的新群集將帶有乙個節點、自己的本地資料儲存裝置以及群集共用資源 —— 通常是磁碟或資料儲存和連線介質資源。

建立群集的最後一步是,在另外將要成為群集成員的每一台計算機上執行安裝實用工具。每當將新節點新增到群集中時,新節點都會自動從群集的原始成員獲得現有群集資料庫的副本。當節點加入或形成群集時,群集服務會更新該節點私有的配置資料庫副本。

如果伺服器執行了群集服務並且無法找到群集中的其它節點,它自己可以形成乙個群集。要形成群集,節點必須能夠獲得對仲裁資源的獨占權。

當最初形成群集時,群集中的第乙個節點將包括群集配置資料庫。每當有新節點加入群集時,新節點都會在本地獲得並保持群集配置資料庫的副本。仲裁資源用恢復日誌(其中含有同節點無關的群集配置和狀態資料)的形式儲存配置資料庫的最新版本。

在群集執行中,群集服務使用仲裁恢復日誌執行以下操作 :

保證只有一組活動、可相互通訊的節點才能形成群集

僅當某個節點可以獲得對仲裁資源的控制權時 , 才允許它形成群集

僅當某個節點可以同控制仲裁資源的節點通訊時 , 才允許它加入或留在現有群集中

從群集中的其它節點和群集服務管理介面的角度看,當形成群集時,群集中的每個節點可能處於三種不同狀態中的一種。事件處理器會記錄這些狀態,而事件日誌管理器會將這些狀態複製到群集的其它節點。群集服務狀態包括:

離線。此時的節點不是完全有效的群集成員。該節點及其群集伺服器可能在執行,也可能未執行。

聯機。此時的節點是完全有效的群集成員。它遵從群集資料庫的更新、對仲裁演算法施加自己的影響、維護心跳通訊,並可以擁有和執行資源組。

暫停。此時的節點是完全有效的群集成員。它遵從群集資料庫的更新、對仲裁演算法施加自己的影響、維護心跳通訊,但它無法接受資源組。它只能支援它當前已擁有的那些資源組。之所以提供暫停狀態,是為了允許執行某些維護。大多數伺服器群集元件會將聯機和暫停視為等價的狀態。

一、集群系統可解決所有的伺服器硬體故障,當某一台伺服器出現任何故障,如:

硬碟、記憶體、cpu、

主機板、i/o板以及電源故障,執行在這台伺服器上的應用就會切換到其它的伺服器上。

二、集群系統可解決軟體系統問題,我們知道,在計算機系統中,使用者所使用的是

應用程式

和資料,而應用系統執行在作業系統之上,作業系統又執行在伺服器上。這樣,只要應用系統、作業系統、伺服器三者中的任何乙個出現故障,系統實際上就停止了向客戶端提供服務,比如我們常見的軟體宕機,就是這種情況之一,儘管伺服器硬體完好,但伺服器仍舊不能向客戶端提供服務。而集群的最大優勢在於對故障伺服器的監控是基於應用的,也就是說,只要伺服器的應用停止執行,其它的相關伺服器就會接管這個應用,而不必理會應用停止執行的原因是什麼。

三、集群系統可以解決人為失誤造成的應用系統停止工作的情況,例如,當管理員對某台伺服器操作不當導致該伺服器停機,因此執行在這台伺服器上的應用系統也就停止了執行。由於集群是對應用進行監控,因此其它的相關伺服器就會接管這個應用。

我們知道集群中的應用只在一台伺服器上執行,如果這個應用出現故障,其它的某台伺服器會重新啟動這個應用,接管位於共享磁碟櫃上的資料區,進而使應用重新正常運轉。我們知道整個應用的接管過程大體需要三個步驟:偵測並確認故障、後備伺服器重新啟動該應用、接管共享的資料區。因此在切換的過程中需要花費一定的時間,原則上根據應用的大小不同切換的時間也會不同,越大的應用切換的時間越長。

如果乙個伺服器要加入現有群集 , 則它必須執行群集服務並且必須成功找到群集中的其它節點。在找到其它節點後,加入的伺服器必須接受群集成員資格驗證,並獲得群集配置資料庫的副本。

加入現有群集的過程開始於 windows server 2003 或 windows 2000 service control manager 在節點上啟動群集服務之時。在啟動過程中,群集服務會配置並裝入該節點的本地資料裝置。它並不會試圖將共用的群集資料裝置作為節點聯機,因為現有群集可能正在使用這些裝置。

為了查詢其它節點 , 會啟動乙個發現過程。當節點發現任何群集成員時,它將執行身份驗證序列。第乙個群集成員會對新加入者進行身份驗證,並且在新伺服器得到成功驗證後返回成功狀態。如果驗證不成功(未能識別待加入節點的群集成員身份,或者它使用了無效的帳戶密碼),則加入群集的請求會被拒絕。

進行成功驗證後,首先聯機的群集節點會檢查加入節點上的配置資料庫副本。如果該副本已過時,對加入伺服器進行驗證的群集節點會為加入的伺服器傳送該資料庫的更新副本。剛加入群集的節點在收到複製的資料庫後,可以用它查詢共享資源並根據需要將它們聯機。

當節點關閉或群集服務被停止時,節點可能脫離群集。但當節點不執行群集操作(比如不向群集配置資料庫提交更新)時,節點也可能被迫脫離(被逐出)群集。

有兩種常用的伺服器集群方法,一種是將備份伺服器連線在主伺服器上,當主伺服器發生故障時,備份伺服器才投入執行,把主伺服器上所有任務接管過來。另一種方法是將多台伺服器連線,這些伺服器一起分擔同樣的應用和資料庫計算任務,改善關鍵大型應用的響應時間。同時,每台伺服器還承擔一些容錯任務,一旦某台伺服器出現故障時,系統可以在系統軟體的支援下,將這台伺服器與系統隔離,並通過各伺服器的負載轉嫁機制完成新的負載分配。

pc伺服器中較為常見的是兩台伺服器的集群,unix系統可支援8臺伺服器的集群系統,康柏的專用系統openvms可支援多達96臺伺服器的集群系統。

在集群系統中,所有的計算機擁有乙個共同的名稱,集群內任一系統上執行的服務可被所有的網路客戶所使用。集群必須可以協調管理各分離元件的錯誤和失敗,並可透明的向集群中加入元件。使用者的公共資料被放置到了共享的磁碟櫃中,應用程式被安裝到了所有的伺服器上,也就是說,在集群上執行的應用需要在所有的伺服器上安裝一遍。當集群系統在正常運轉時,應用只在一台伺服器上執行,並且只有這台伺服器才能操縱該應用在共享磁碟櫃上的資料區,其它的伺服器監控這台伺服器,只要這台伺服器上的應用停止執行(無論是

硬體損壞、作業系統宕機、應用軟體故障,還是人為誤操作造成的應用停止執行),其它的伺服器就會接管這台伺服器所執行的應用,並將共享磁碟櫃上的相應資料區接管過來。其接管過程如下圖所示(以應用a為例):

1.應用a正常工作時;

2.應用a停止工作後,其它的備用伺服器將該應用接管過來。 具體接管過程分三部執行: a.系統接管 b.載入應用 c.客戶端連線

什麼是伺服器

專業上講伺服器是一種高效能計算機,作為網路的節點,儲存,處理網路上80 的資料,資訊,因此也被成為網路的靈魂。伺服器是指管理資源並為使用者提供服務的計算機軟體。通常分為檔案伺服器,資料庫伺服器,應用程式伺服器。執行以上軟體的計算機或計算機系統,也被稱為伺服器。相對於普通計算機,伺服器在穩定性,安全性...

什麼是 RADIUS 伺服器?

radius 是一種用於在需要認證其鏈結的網路訪問伺服器 nas 和共享認證伺服器之間進行認證 授權和記帳資訊的文件協議。radius 的關鍵功能部件為 客戶機 伺服器體系結構 網路訪問伺服器 nas 作為 radius 客戶機執行。客戶機負責將訂戶資訊傳遞至指定的 radius 伺服器,然後根據返...

什麼是雲伺服器?

什麼是雲伺服器 雲伺服器elastic compute service ecs 是阿里雲提供的一種基礎雲計算服務。它能幫助您快速的構建更穩定 安全的應用,提高運維效率,降低it成本,使您更專注於核心業務創新。雲伺服器說白了就是遠端不知放在哪個機房的一台電腦,可以通過遠端控制部署自己的專案。雲伺服器相...