Ganglia分組監控

2021-09-22 00:17:05 字數 1275 閱讀 9013

行文之前,表達一下小鬱悶。ganglia官方把分組監控的幫助文件放到了quick start guide,而不是configuration,讓我一番好找。。。

ganglia的分組監控,實施起來其實很簡單,官方文件已經給出了示例。

總結起來,實施分組監控,有下面幾個關鍵點:

一是多播和單播。分組監控最好用單播方式,文件也給出了單播模式的配置方式。

二是send_metadata_interval設定的間隔時間,官方推薦30秒。 三

四、分組的標識是gmond.conf配置檔案中的cluster name值和port值,同一分組中的機器的這兩個值都必須一致,不同組的機器,這兩個值不同。

cluster name的值要與gmetad.conf中的相應條目保持一致;port值的配置需要在udp_send_channel、udp_recv_channel和tcp_accept_channel三個部分同時設定,注間埠不要衝突。

gmetad.conf,只修改了data_source,其它部分保持原狀:

data_source "internal" 10 192.168.9.53:8649 

data_source "tangshan" 10 10.64.131:8650 10.10.64.132:8650 

data_source "jiaxing" 10  10.10.19.170:8653 10.10.19.94:8653

解釋一下,每個集群中都有很多伺服器,但我們不需要把集群中的每台伺服器都寫在data_source條目裡,因為,雖然在理論上,ganglia伺服器端要到每個節點上去獲取監控資訊,但實際上不必如此;集群內的每台機器都會保留其它機器的資訊,伺服器端只需要連線集群內的任意一台機器,就可以整個集群內所有節點的監控資訊。

在tangshan和jiaxing兩個集群的配置中,我寫了兩台伺服器,是乙個冗餘設計。ganglia伺服器端預設去第一台伺服器獲取資訊,如果這台伺服器因為某些原因而沒有被獲取到,伺服器端會自動到第二台伺服器上獲取監控資訊。

gmond.conf,以tangshan集群為例,修改下列部分,其它保持預設:

globals  

cluster  

host  

udp_send_channel  

udp_recv_channel  

tcp_accept_channel  

access  

} } 

其它分組,只需要修改cluster name,以及port值就可以了!要新增分組,也很簡單。

監控截圖:

ganglia集群監控

安裝的方法網上一大堆,不同的系統有不同的方法,只有試過才知道那個最適用自己集群的。我的系統是rhel,就直接yum安裝 後來發現圖表的座標沒顯示出來,找了最新版的gweb放到apache的目錄下,還是不行,就猜想可能是rrdtool的版本過低導致,因此檢視了一下rrdtool的版本,發現是1.2的,...

ganglia 監控mysql Ganglia監控

一 ganglia是什麼?ganglia是由uc berkeley發起的乙個開源專案,主要通過收集各節點上的度量資料 如處理器速度 記憶體使用量等 實現系統效能的監控。ganglia的核心包含gmetad gmond以及web前端三部分,這三部分之間通過xdl xml的壓縮格式 或者xml格式傳遞監...

使用Ganglia監控Hadoop

hadoop本身提供了很多監控工具的介面,如jmx nagios ganglia等。使用ganglia監控hadoop,配置起來非常簡單,只需要修改 hadoop home conf hadoop metrics.properties檔案,把相關的配置段修改為下面的示例 configuration ...