FPGA異構計算架構對比分析

2021-10-17 07:20:46 字數 2850 閱讀 9014

ai晶元主要分為cpu 、gpu、fpga以及asic。其中以cpu、gpu、fpga、asic的順序,通用性逐漸減低,但運算效率逐步提高。

fpga,即現場可程式設計門陣列,它是在pal、gal、cpld等可程式設計器件癿基礎上進一步發展的產物。

為解決能耗限制,無法使處理器核心同時運作,及效能提公升有限的問題,業界提出的另乙個方案就是採用「定製計算」,也就是為特定的工作場景和負載優化硬體設計。fpga(「現場可程式設計邏輯陣列」)應運而生。

fpga本質是一種可程式設計的晶元。可以把硬體設計重複燒寫在它的可程式設計儲存器裡,從而使fpga晶元可以執行不同的硬體設計和功能。fpga具備以下優勢:

可程式設計靈活性高:fpga屬於半定製電路,理論上,如果fpga提供的閘電路規模足夠大,通過程式設計可以實現任意asic和dsp的邏輯功能。

開發周期短:fpga不需佈線、掩模和定製流片等,晶元開發流程簡化。傳統的asic和soc設計週期平均是14到24個月,用fpga時間可以平均降低55%。

並行效率高:fpga屬於平行計算,一次可執行多個演算法指令。雖然普遍主頻較低,但對部分特殊的任務,大量相對低速並行的單元比起少量高效單元而言效率更高。

全球fpga市場規模:17年67.5億美元,預計2023年,cagr為8.28%,預計2023年可達到84億美元;全球fpga競爭栺局:「兩大兩小」。

1. 「兩大」:賽靈思和altera,主要布局5g以及ai,主打可程式設計邏輯器件,帶有軟體工具癿可程式設計邏輯技術、智財權(ip)和技術服務,合計佔87%市場仹額;

2. 「兩小」:lattice和microsemi,其中lattice主要面向iot市場,而microsemi主要聚焦航空航天和軍工市場。

目前國外龍頭工藝技術已達7nm、10nm級,可實現4-5億門器件規模。5g無線,資料中心,汽車,無線通俆, ai智慧型,工業,消費電子,醫療科學等,正在成為全球fpga市場規模增長的主要驅勱力。

作為加速應用癿ai晶元,主要癿技術路線有三種:gpu、fpga、asic。目前gpu是市場上用亍ai計算最成熟應用最廣泛的通用型晶元,在演算法技術和應用層次處於發展期, gpu由於其強大的計算能力、較低的研發成本和通用性將繼續占領ai晶元的主要市場份額。

未來在雷射雷達、無人機、無人駕駛、智慧型機械人等高階裝置方面對計算能力也會有極大的提公升,因此作為人工智慧的底層計算能力(晶元)存在著大機會。其中, fpga是可重新程式設計的矽晶元,在訊號處理和控制應用中,它已經取代了專用積體電路( asic)和處理器。

ai包括訓練和推斷兩個環節,訓練過程是指在已有資料中學習,獲得判斷能力癿過程。對神經網路而言,訓練過程通過不斷更新網路引數,使推斷誤差最小化;推斷過程則是指對新癿資料,使用訓練過程形成癿能力完成特定任務(比如分類、識別等)。推斷是直接將資料輸入神經網路並評估結果的正向計算。

訓練:計算規模龐大,涉及到大量訓練資料和複雜癿深度神經網路,目前應用最多癿主要還是gpu。

推斷:包括大量的矩陣運算,但相比較訓練環節計算量較少,不僅cpu或gpu可以迕行運算,也可使用fpga以及asic。

雲端推斷

邊緣推斷

英特爾 arria fpga和stratix系列應用廣泛,如資料中心,軍事,廣播,汽車和其他高階市場。

2023年4月3日,英特爾宣布推出全新產品家族英特爾agilex fpga。agilex fpga是第一款整合了intel幾乎所有當前創新技術的fpga產品,包括10nm製造工藝、異構3d sip窞體封裝、pcie 5.0匯流排、ddr5/hbm/傲騰dc永續性記憶體、easic裝置one api統一介面、cxl快取和記憶體一致性高速匯流排。

agilex fpga基於創新型異構 3d sip 技術,將模擬、記憶體、自定義計算、自定義 i/o ,英特爾 easic和fpga邏輯結構整合到乙個晶元封裝中。英特爾可提供從 fpga 到結構化 asic的遷移路徑。可為邊緣計算、嵌入式、網路(5g/nfv)、資料中心帶來發展的應用和靈活的硬體加速。

參考:國產fpga研究框架

往期精選

彙總篇 | fpga零基礎學習系列

fpga晶元行業科普

一周掌握 fpga vhdl day 7 暨彙總篇

一周掌握fpga verilog hdl語法 彙總篇

時序分析理論和timequest使用_中文電子版

資料彙總更新|fpga軟體安裝包、書籍、原始碼、技術文件…(2021.01.04更新)

HSA AMD異構計算架構

當前的cpu和gpu是分立設計的處理器,不能高效率地協同工作,編寫同時執行於cpu和gpu的程式也是相當麻煩。由於cpu和gpu擁有獨立的位址空間,應用程式不得不明確地控制資料在cpu和gpu之間的流動。cpu 通過系統呼叫向gpu傳送任務,此類系統呼叫一般由gpu驅動程式管理,而驅動程式本身又受到...

關於CPLD與FPGA的對比分析

1.pld fpga cpld pld programmable logic device 可程式設計邏輯器件,數字積體電路半成品,晶元上按照一定的排列方式整合了大量的門和觸發器等基本邏輯元件,使用者按照設計要求運用開發工具將這些片內的元件連線起來,此過程稱為程式設計 fpga 基於查詢表技術,要外...

關於CPLD與FPGA的對比分析

1.pld fpga cpld pld programmable logic device 可程式設計邏輯器件,數字積體電路半成品,晶元上按照一定的排列方式整合了大量的門和觸發器等基本邏輯元件,使用者按照設計要求運用開發工具將這些片內的元件連線起來,此過程稱為程式設計 fpga 基於查詢表技術,要外...