為什麼對基礎設施的監控變得如此重要?

2021-07-03 17:59:09 字數 2441 閱讀 4170

稍微懂點雲計算的人都知道三個概念:iaas「infrastructure as a service」、paas「platform-as-a-service」和saas「software-as-a-service」,其中 iaas 就是我們常說的基礎設施服務。

簡單而言,iaas 提供了雲計算基礎架構,包括伺服器、儲存、網路和作業系統。它作為一種按需服務,使得客戶無需購買伺服器、軟體、資料庫空間或網路裝置,而只要按需購買這些資源的外包服務就可以了。但是購買了這些資源,並不意味著一勞永逸,這些資源能不能穩定、高效的工作?這其實是乙個新的挑戰!

眾所周知,幾乎所有的應用程式通常都是執行在乙個大型動態的環境上,它們依賴於成百上千臺主機。當然,這樣的方式非常有利於擴充套件,能夠保證良好的使用者體驗。但是,對運維和業務人員來說,這簡直就是「噩夢」,那些傳統的監控方式已經跟不上雲時代的要求了。

首先,人類已經很難從大規模海量的資料中識別出那些有問題的節點;其次,伺服器本身也在不斷的變化——根據企業的需求進行動態的拓展或者縮減,單個主機經常會出現響應問題;所以,區分出哪些伺服器是否處於乙個正常的狀態並不是一件很簡單的事情。那麼,我們就需要乙個現代化的監控平台:

第一,必須能夠毫不費力地跟蹤我們所有的伺服器,並且能夠在資料量激情的情況下保持穩定;

第二,必須能夠分辨出那些可執行程式,盡可能少出現誤報問題,還要避免「興師動眾」,反而忽略更重要的問題;

第三,必須能夠收集足夠多的資訊,使我們能夠快速診斷出問題發生的根本原因,當然,這也意味著我們的監控平台應該與關鍵技術相互配合;

第四,應該還能收集詳盡的資料以供我們進行分析,並能保留長期的資料用於對未來趨勢的**;

第五,必須能夠讓我們監控到所有的主機狀態,同時也能監測到特定屬性的主機。

最後一點,這個作為我們「操作神經中樞」的監控平台,必須能夠幫助我們的團隊高效地發現潛在問題的資訊,如果有乙個視覺化的儀表板那就更好了,這樣就可以有助於我們進行快速、明確的團隊溝通。

當然,現在有很多伺服器端的監控軟體,而且針對伺服器的效能監控也是乙個比較新的網路管理方向。現在市面上有不少免費的工具,包括不少開源的產品如 nagios ,zabbix 等等,當然,還有一些比較有技術底蘊的公司,像國內 apm 行業的領軍企業 oneapm 也推出了免費的伺服器監控產品 oneapm servers。

zabbix

zabbix 是乙個基於 web 介面的提供分布式系統監視以及網路監視功能的企業級的開源解決方案。能監視各種網路引數,保證伺服器系統的安全運營;並提供靈活的通知機制以讓系統管理員快速定位,解決存在的各種問題。

zabbix 由兩部分構成,zabbix server 與可選元件 zabbix agent,zabbix server 可以通過 snmp,zabbix agent,ping,埠監視等方法提供對遠端伺服器/網路狀態的監視,資料收集等功能,它可以執行在 linux、solaris、hp-ux、aix,free bsd、open bsd以及os x 等平台上。

zabbix 主要功能包括: cpu 負荷,記憶體使用,磁碟使用,網路狀況,埠監視,日誌監視等等。

nagios

nagios 是一款開源的免費網路監視工具,能有效監控 windows、linux 和 unix 的主機狀態,交換機路由器等網路設定,印表機等。在系統或服務狀態異常時發出郵件或簡訊報警第一時間通知**運維人員,在狀態恢復後發出正常的郵件或簡訊通知。

nagios 可以監控的功能包括:監控網路服務;監控主機資源;簡單地外掛程式設計使得使用者可以方便地擴充套件自己服務的檢測方法;並行服務檢查機制;具備定義網路分層結構的能力;報警「通過 email、簡訊、使用者定義方式」;定義一些處理程式,使之能夠在服務或者主機發生故障時起到預防作用;自動的日誌滾動功能;支援並實現對主機的冗餘監控;可選的 web 介面用於檢視當前的網路狀態、通知和故障歷史、日誌檔案等。

oneapm servers 是一款商業級的伺服器監控產品。對比開源產品來講,在部署安裝和學習成本上都佔據壓倒性的優勢。更重要的是,該產品是面向所有使用者的效能監控,承諾永久免費,所以剛推出不久就受到很多的關注。

簡易部署

如果,你想要使用伺服器監控,只需要完成以下四個步驟:

特色功能

oneapm servers 通過觀察、分析關鍵的系統引數,包括 cpu 利用率、物理記憶體、網路活動、程序、磁碟利用率及容量,展現當前伺服器的健康狀況。oneapm servers 目前包含四大功能:

現在,oneapm 剛剛推出不久的 oneapm servers 產品能夠對企業 idc 和雲計算中心內的基礎元件進行實時的視覺化管理。該套件為使用者提供基礎元件的集中監控、展現、預警、分析、管控的整體解決方案。通過單一探針,實現對網路裝置、主機、作業系統、中介軟體、資料庫、儲存等126 種產品的 5 萬多項效能指標的集中監控和管理。

Docker的測試基礎設施

jessie frazelle是docker核心團隊成員,負責docker的測試基礎設施。他描述了這些測試設施是如何構建在docker容器之上的。這些測試基礎設施由大約50臺伺服器組成。它們涵蓋六種docker儲存映象使用的儲存驅動 所有linux發行版和docker支援的各種linux核心版本。w...

企業的IT基礎設施部署思路

自從有了虛擬機器部署方案之後,許多大型企業都採用了這一方便快捷的部署方案,但cio們隨之而來的問題是 虛擬機器數量在短短幾年內呈10倍數的在增長,運營的成本也在大幅增加,運維環境在不斷地複雜化,而且呈現越來越低效的情形,而回歸到單設施的有效利用率上來看,單個裝置的利用率越沒有得到明顯提公升,這也驗證...

物聯網時代的智慧型基礎設施

在當今時代,實施利用物聯網和聯網技術的智慧型城市有助於促進經濟發展,改善基礎設施和環境,加強交通系統,並優化公共資產管理成本。智慧型城市的互聯技術和物聯網解決方案在城市轉型中發揮著重要作用。利用物聯網和聯網技術實現智慧型城市有助於提高城市服務的質量 效能 互動性,並優化降低成本的資源。智慧型城市基礎...