巨杉案例 基於日誌的大資料運維管理平台

2021-08-19 12:44:46 字數 2003 閱讀 8318

在電信行業,運營商構建了非常多的應用系統為廣大消費者提供各種特色服務,有一些系統的功能由於在業務操作的上下文中,涉及到多個業務系統的子功能,需要多個系統共同提供服務才能正常工作,導致任何系統出現異常都會影響到其餘的系統,對企業形象和社會造成非常惡劣的影響。

而各業務系統的應用日誌是了解業務系統是否正常執行的最直接可靠的視窗,通過統一收集、分類應用日誌,並實現日誌分析,可實現如下價值:

因此,電信運營商對於應用日誌的監控力度非常大,一旦出現異常訊號,需要及時通知操作人員進行問題定位與問題解決。但這種方式只能進行問題的事後補救處理,不能預先發現應用系統的隱藏問題。而且由於日誌資料是典型的文字類半結構化大資料,傳統的關係型資料庫無法滿足海量日誌資料的儲存與實時查詢分析需求。

1.使用者業務需求

2.業務與技術挑戰

原解決方案

如下圖所示,使用者在專案初期基於hadoop hdfs及greenplum構建日誌監控系統,並將原始日誌檔案儲存在nas檔案系統中。

然後通過流處理引擎將日誌中的每個交易號對應的日誌報文對應檔案的偏移記錄(位置)轉換成乙個格式化記錄,並將生成的資料儲存在 gp(greenplum) 中。

使用者如果希望查詢某個交易號的明細日誌,需要先到gp 庫中查詢這個交易號對應在哪個檔案中,並且知道了它在檔案的偏移情況,開啟檔案,跳轉到對應的偏移上,才能看在完整的明細日誌。

原方案存在問題與不足如下:

3.解決方案

使用者基於sequoiadb資料庫+hadoop框架重構了智慧型日誌分析系統,在已有日誌監控系統基礎上增加智慧型日誌分析功能,可自動根據應用日誌分析錯誤隱患,提高應用的糾錯能力。

如上圖所示,資料採集端將新增資料實時載入到sequoiadb資料庫集群中,系統定時觸發程式每隔5分鐘啟動hadoop mapreduce分析程式,分析結果通過gp進行多維分析查詢展現,當系統出現操作異常或者是使用者違規操作時,立刻通過進行系統操作告警。業務人員使用者可在web操作介面通過sql介面實時查詢應用日誌,實現對錯誤資訊的實時定位。

在此系統架構中,sequoiadb巨杉資料庫發揮三大作用:

4.專案成果

智慧型運維監控

系統很好地滿足了對應用日誌資料的實時統計及異常檢測的功能需求。

實時統計

異常檢測

運維簡單方便

相比起單純的hdfs檔案系統,sequoiadb資料庫在實現了對應用日誌資料的集中統一儲存的同時,滿足了全量日誌實時sql查詢及向分析程式輸送資料的需求。

相比於引入hbase,impala, storm, pig等框架的方法,基於sequoiadb資料庫的方案運維簡單,開發方便,管理快捷,功能完善。

2023年9月22日-23日,sdcc2016大資料技術&架構實戰峰會將在杭州舉行,兩場峰會大牛講師來自阿里、京東、蘇寧、唯品會、美團點評、游族、餓了麼、有讚、echo等知名網際網路公司,共同**海量資料下的應用監控系統建設、異常檢測的演算法和實現、大資料基礎架構實踐、敏捷型資料平台的構建及應用、音訊分析的機器學習演算法應用,以及高可用/高併發/高效能系統架構設計、電商架構、分布式架構等話題與技術。

9月5日-18日是八折優惠票價階段,5人以上**或者購買兩場峰會通票更有特惠,限時折扣,預購從速(票務詳情鏈結)。

大資料運維框架 二 ansible的離線安裝

rhel 6.4 自帶python 2.7 其中有一些包有多個版本,選擇其中乙個就可以,同時要注意修改指令碼中的對應路徑 下面是ansible.sh的內容 bin sh 1.建立資料夾 mkdir opt ansible 2.移動資源到目標資料夾 cp rf res opt ansible 3.安裝...

論資料庫運維的全流程管控技術

本文講的是論資料庫運維的全流程管控技術,重建設 輕管理 一直是我國各行業資訊化發展的主要困境,這個問題在資料庫系統的建設 管理工作中同樣存在。近年來,這種局面造成的後果已開始明顯顯現 各類來自內部或第三方外包人員的資料洩露 丟失和被篡改事件頻頻發生,由此導致的珍貴資料資產損失和相關系統功能癱瘓等情況...

資料應用案例 基於使用者畫像的騰訊大資料防刷架構

1.羊毛黨角色 1 軟體製作團夥 開發黑產工具,如註冊自動機 刷單自動機等 2 簡訊代接平台 實現簡訊的自動接髮 3 賬號 團夥 養各類賬號,通過轉賣賬號獲利 4 刷單團夥 到各平台刷單,獲取優惠,然後通過第三方平台 優惠套現 2.對抗刷單的三個主要環節 1 註冊環節 識別虛假註冊的賬號 2 登入環...