對話阿里雲異構計算掌舵人 人工智慧爆發三要素

2021-09-23 04:28:06 字數 2421 閱讀 3460

計算,正在撬動人工智慧產業這個千億級的市場。

傳統通用計算無法滿足人工智慧對爆發的計算能力需求,異構計算中gpu/fpga等高並行、高密集的計算能力被認為是現階段挑起人工智慧產業的大樑。

異構計算是指不同型別的指令集和體系架構的計算單元組成的系統的計算方式,如「cpu+gpu」,"cpu+fpga「等,」更適合深度學習、基因匹配、金融分析等計算密集型領域。

昨天,阿里雲對外展示了異構計算產品家族,將異構計算的能力帶到雲上對外服務。

會後,我們採訪了阿里雲異構計算掌舵人張獻濤。

張獻濤,花名旭卿,武漢大學資訊保安博士,是xen、kvm等多個開源虛擬化專案的主要貢獻者,目前主要負責阿里雲虛擬化技術、高效能計算產品、異構計算產品以及創新型別產品的技術和研發的團隊。

在這次對話中,張獻濤分享了對人工智慧與異構計算的關係,以及對未來計算大戰的思考。

人工智慧爆發三要素:演算法、計算力、資料

人工智慧爆發有三要素:演算法,計算力,資料。

張獻濤指出,人工智慧的概念提出60多年了,這幾年才呈現出爆發的趨勢,不單單是因為演算法改進、資料積累,更重要的是計算能力的變革。一般企業都有自己的演算法和資料,但在計算力的獲取上一直有比較高的門檻。

異構計算被認為是更適合人工智慧的計算形態,它的優點是具有比傳統cpu平行計算更高效率和低延遲的計算效能,在處理物聯網場景下的ai應用時,異構計算比cpu的處理效率高30倍以上。張獻濤表示。

在過去,異構計算的採購、部署以及使用門檻對絕大多數企業、使用者來說都很高,比如小量的使用者基本上沒有議價能力,特別是購買fpga板卡,量少的話採購**特別高。此外,交付週期是另一大痛點,從機型選擇、硬體架構設計、**商選擇、機房選擇、財務審批通常要幾個月時間。採購之後型號就固定了,有新品出現只能追加預算購買,線下的gpu/fp又無法和線上服務打通。

面向多場景的異構計算加速平台

張獻濤指出,雲已經證明了是提供計算能力的最佳交付方式,所以把gpu/fpga的計算能力放在雲端對外服務是一件再自然不過的事。

「阿里雲在短時間裡先後推出彈性gpu和fpga解決方案,目的就是降低異構計算資源使用的門檻,對人工智慧有計算需求的企業可以隨買隨用。」張獻濤表示,

雲是計算能力的放大器

相比cpu,gpu有更高的並行度、更高的單機計算峰值、更高的計算效率;而fpga則擁有更高的每瓦效能、非規整資料計算更高的效能、更低的裝置互聯延遲。

「雲是計算能力的放大器,將gpu和fpga解決方案部署在雲端意味著優勢的進一步放大。」張獻濤介紹,虛擬化技術讓gpu/fpga的計算資源可以即買即用,彈性伸縮,無需擔心效能瓶頸,還能以更低的**享受到效能更強的gpu/fpga計算能力。

「我們提供了25/100gb roce走rdma協議直連,可以多機多卡,用非常多的gpu/fpga裝置集群來共同訓練乙個模型,大大減少使用者訓練的時間,從幾周到乙個月縮短到一天或者幾個小時的級別。」張獻濤強調。

異構計算的未來:gpu、fpga、asic三分天下

從市場角度來看,gpu處理器佔據了異構計算的主流地位,但對未來的趨勢,張獻濤表示,「隨著fpga的生態環境的建立和完善、asic晶元的逐漸成熟,未來異構計算領域會呈現gpu、fpga、asic晶元三分天下的局面,gpu、fpga、asic晶元都會有自己獨特的特長和應用領域,有自己獨特的客戶群體。」

阿里雲提供同時覆蓋intel和xilinx兩大fpga廠商的解決方案

這也是張獻濤團隊專注的方向,接下來團隊會發布包括8卡/16卡gpu產品、下一代的volta架構的gpu產品、新一代的fgpa的產品,而asic晶元的產品上雲也正在研發當中。

目前他所帶領的團隊主要有兩個目標:一方面致力於讓異構計算變成使用者即買即用的計算資源,提供最為全面的異構計算產品方案;另一方面致力於讓使用者能夠用好異構資源,充分發揮雲上各個產品之間的統一排程能力,讓阿里雲在人工智慧方面的服務更具備競爭力,把異構計算變成一種普惠的計算能力。

在10月11日舉行的2017杭州雲棲大會上,阿里雲還將推出更多個性化的人工智慧產品及服務,期間將有20餘場人工智慧相關的峰會和分論壇,涉及基礎設施、ai基礎技術、ai產品以及ai行業解決方案等領域。阿里巴巴及合作夥伴將分享ai在資料中心、電子商務、工業製造、城市管理、藝術設計等行業的前沿經驗,並展示最新技術。

對話阿里雲異構計算掌舵人 人工智慧爆發三要素

計算,正在撬動人工智慧產業這個千億級的市場。傳統通用計算無法滿足人工智慧對爆發的計算能力需求,異構計算中gpu fpga等高並行 高密集的計算能力被認為是現階段挑起人工智慧產業的大樑。異構計算是指不同型別的指令集和體系架構的計算單元組成的系統的計算方式,如 cpu gpu cpu fpga 等,更適...

HSA AMD異構計算架構

當前的cpu和gpu是分立設計的處理器,不能高效率地協同工作,編寫同時執行於cpu和gpu的程式也是相當麻煩。由於cpu和gpu擁有獨立的位址空間,應用程式不得不明確地控制資料在cpu和gpu之間的流動。cpu 通過系統呼叫向gpu傳送任務,此類系統呼叫一般由gpu驅動程式管理,而驅動程式本身又受到...

異構計算全新公升級,阿里雲全方位釋能人工智慧產業

計算正推動著人工智慧產業更大規模的爆發。9月12日,阿里雲宣布推出全新一代異構加速平台,為人工智慧產業提供多場景化的全球加速能力。這是阿里雲異構計算家族首次亮相,涵蓋gpu fpga在內等6款異構例項,可滿足從圖形渲染到高效能計算及人工智慧等複雜應用的計算需求。特別是在人工智慧領域,可將深度學習成本...