阿里巴巴發布智慧型運維故障管理AI 生態計畫

2021-09-13 17:09:14 字數 2273 閱讀 3979

摘要: 為響應馬老師「家國情懷,世界擔當」的號召,開放「ai+」生態計畫,將讓集團內部服務過程中積累下的技術與經驗更好地回饋社會,任何企業或合作夥伴均可以簡單方便的接入阿里巴巴智慧型故障管理平台,通過對接入資料的訓練學習實時提供異常檢測、關聯分析、根因定位的能力,使原有的it管理模型瞬間實現低成本的智慧型化公升級,為it同行們更便捷的提公升工作效率、降低人力成本盡乙份綿薄之力。

6月7日,2018雲棲大會·上海峰會在上海世博中心舉行。本次大會以「驅動數字中國」為主題,聚焦人工智慧、金融、零售、iot等行業,聚焦產業生態新發展,展現產業鏈上下游新應用,推動雲端新融合,降低行業企業資訊化成本,助力上海經濟新發展。大會全面展現數位化魅力,如何利用「數字」帶動企業轉型、促進業態發展、創造產業新動能,激發數字經濟新引擎。
對於當前it運維圈子裡最火爆的aiops概念,本次大會也設立了主題分會場,共同**人工智慧在it運維領域的應用與實踐。

開放「ai+」生態計畫,回饋社會

阿里巴巴全球執行指揮中心(goc)掌門人沈乘黃首先分享了「智慧型運維在阿里巴巴線上故障管理領域的應用經驗」。沈乘黃站在集團業務連續性保障的角度,講述了goc團隊如何通過機器學習應對每秒數千萬資料的處理,把握阿里每一項業務的執行狀況,實現對近百個技術團隊、數萬名研發人員的應急資訊實時互聯,讓一切線上問題無所遁形,讓所有阿里技術團隊令行禁止。

同時,沈乘黃正式宣布,為響應馬老師「家國情懷,世界擔當」的號召,開放「ai+」生態計畫,將讓集團內部服務過程中積累下的技術與經驗更好地回饋社會,任何企業或合作夥伴均可以簡單方便的接入阿里巴巴智慧型故障管理平台,通過對接入資料的訓練學習實時提供異常檢測、關聯分析、根因定位的能力,使原有的it管理模型瞬間實現低成本的智慧型化公升級,為it同行們更便捷的提公升工作效率、降低人力成本盡乙份綿薄之力。

智慧型演算法,為業務穩定連續執行保駕護航

阿里巴巴高階技術專家王肇剛由淺入深分享了「全球執行指揮中心(goc)團隊提供的智慧型演算法模組的技術實現與應用心得」,講述了如何在複雜的業務場景下迅速發現異常事件,並從千萬個指標中尋找關聯事件,最終確定異常事件的根源,並通過應急、通知、恢復、覆盤、演練等一系列動作完成故障管理的閉環,最終確保業務穩定連續的執行。

單指標多維下鑽分析

當業務指標總量異常出現時,準確地智慧型定位到出現異常的分量或分量組合。

多指標相關性分析

• 當指標異常時,動態發現有相似**形態的相關指標,為原因定位提供重要線索。

• 通過離線分析,發現業務報警之間的關聯規則,當單業務異常時能夠對其它業務進行提前預警。

可疑應用/事件分析

• 自動基於運維資料倉儲進行相關應用/事件檢索,鎖定懷疑範圍。

開放合作,為使用者帶來更多價值

大會所在的世博中心曾經是上海世博會的會議中心,秉承著平等開放、合作共贏的理念向全世界展示了中國的新面貌,本次雲棲大會也正傳承了開放合作的理念,首批「ai+」生態合作夥伴涵蓋了網路分析、應用交付、雲計算服務、日誌分析、業務運維等不同領域。
其中成都科來軟體****技術副總裁龍成、深信服科技股份****研發部總經理邱亮、上海駐雲資訊科技****執行總監李俊濤、北京優特捷資訊科技****(日誌易)技術總監饒琛琳、雲智慧型(北京)科技****高階技術顧問楊路分別在其各自領域就智慧型運維的落地實踐,以及與阿里巴巴智慧型故障管理平台結合後為客戶帶來的價值提公升做了分享,讓企業在智慧型化公升級的過程中有更多的方案選擇。

阿里巴巴研究員劉國華 阿里巴巴智慧型運維體系建設

這些創新支援了現有所有ai業務的發展,同時我們也把ai融入到基礎設施領域,讓ai重塑現有的基礎設施。我們把智慧型化帶來的價值分為三層 最後一層是變革。當我們把智慧型化的能力運用到平台,就有能力把特殊的點轉化為極大的優勢。以前所有的硬體故障發生的時候,所有的資料中心的運維模式都是屬於被動式響應。當智慧...

阿里巴巴研究員劉國華 阿里巴巴智慧型運維體系建設

摘要 本文整理自劉國華在2018年開放資料中心峰會 open data center summit 2018 開幕式上的演講。在演講中,劉國華介紹了智慧型化給阿里巴巴未來基礎設施帶來的三大價值 資料驅動決策 全域性優化和變革。我們已經開始大規模使用液冷集群來支援高密度計算 我們在fpga建設了統一的...

實戰 阿里巴巴 DevOps 轉型後的運維平台建設

摘要 阿里巴巴devops轉型之後,運維平台是如何建設的?阿里巴巴高階技術專家陳喻結合運維自身的理解,業務場景的分析和業界方 的一些思考,得出來一些最佳實踐分享給大家。前言 我是這個應用的 owner 是阿里巴巴devops轉型的重要策略,運維有了這個策略以後,pe大量的日常工作就可以釋放出來,會有...