ORACLE集群管理 核心元件CSS

2021-10-01 08:43:02 字數 1104 閱讀 7009

1 功能結構圖

1 分析過程

1 作業系統被啟動,並呼叫/etc/inittab檔案中gi相關的指令碼 

h1:35:respawn:/etc/init.d/init.ohasd run>/dev/null 2>&1 2  ohasd.bin守護程序啟動,該程序負責啟動所有的**程序,包括cssdagent**程序。

3 cssdagent**程序啟動ocssd.bin程序。

4 ocssd.bin程序訪問gpnp.bin,以獲得構建集群的基本資訊,包括集群名稱、集群gid、集群私網資訊、vf位置等資訊。

5 獲得資訊之後,ocssd.bin

和遠端節點通訊,並訪問vf獲得本地節點編號,加入集群。

2  occd啟動日誌

1 occd.bin程序被啟動。

2 ocssd.bin和gpnp.bin通訊,獲取gpnp profile和vf的discovery string並在對應的路徑中尋找vf.

3 獲取到vf之後,獲得一些配置引數資訊,包括missscount、reboot time、long io timeout、 short io timeout等

4 ocssd.bin繼續和gpnp通訊,獲取私網資訊和其他節點通訊。

5 occsd.bin通過gipc.bin程序獲取本地節點和遠端節點的具體鏈結私網資訊,

6 節點連線建立,集群重新配置,集群列表更新

3 維護集群一致性

一致性機制:

1 確定節點的聯通性(心跳),以便節點之間能夠彼此了解情況。

2 用乙個或幾個共享位置來儲存節點聯通性資訊,以便在集群重新配置時做出正確的決定,更新集群列表。

3 本地節點自我監控,以便本地節點出現問題時,主動離開集群,避免不一致問題產生。

即:nhb\dhb\lhb3種心跳機制。

ORACLE集群管理 故障思路總結

1同一子網出現同名集群,導致gpnp.bin程序異常,導致cssd.bin程序異常,導致節點無法加入集群。2 gipc.bin程序異常導致私有網路異常穩定後不能正確識別私有網路導致節點無法正常啟動,加入集群。3 oracle home檔案系統100 導致v asm diskgroup檢視顯示為空。4...

Oracle核心管理 事務IMU

在傳統裡面oracle對undo表空間和普通表空間是一視同仁的。都是在buffer cache裡面分配記憶體區,都是用dbwr程序定時寫到磁碟上。乙個事務開始時,在乙個相對空閒的undo段段頭裡面獲得乙個槽位,寫上事務資訊。1.段頭可能不在記憶體裡面,就需要通過io把段頭放在記憶體裡去 2.接下來獲...

oracle集群管理之crsctl和srvctl

crsctl命令是我們和oracle集群軟體的乙個介面,用於解析和呼叫oracle集群軟體的物件。可以通過crsctl命令啟動和停止oracle集群的相關資源,也可以實現啟用和禁用相關集群程序。使用srvctl來管理資料庫配置資訊。您可以使用srvctl命令新增,刪除,啟動,停止,修改,啟用和禁用許...