AI晶元 寒武紀DaDianNao結構分析

2021-08-27 18:34:22 字數 974 閱讀 4121

dadiannao

寒武紀的dadiannao的誕生稍晚於diannao,同樣也是在2023年。(這裡僅僅指**發表時間)

如果把diannao看作是嵌入式終端使用的處理器,那麼dadiannao就是伺服器上用的大規模高效能處理器。

dadiannao其實就是採用的diannao的nfu作為核心,然後在一塊晶元上同時放置了16個nfu,於是乎,效能也就是diannao的16倍。

文章說,在dadiannao的設計過程中,首先想到的是,直接將diannao中nfu的邏輯資源擴大成原來的16倍即可簡單實現效能16倍的提公升。但是這裡就要考慮晶元上實際的電晶體布局及佈線。發現,如果單純擴大nfu規模,那麼最終佈線所占用的晶元面積遠遠超過nfu邏輯模組,貌似並不高效,如下圖中的figure4所示。

於是乎,就想到了多核並行的架構。

將上面的大nfu拆分成16個小nfu(diannao),通過合理布局佈線,能夠大幅縮小佈線需要的面積,最終面積的減小28.5%,而效能與上面的設計相同。

晶元上,那可真的是寸土寸金。

沒說的,選第二種,也就是下圖中的figure5。

到目前為止(2023年),國內的人工智慧公司,大部分還是侷限在演算法領域,並不關注底層硬體。少數幾個大體量的ai獨角獸,如寒武紀/商湯/深鑑/地平線/位元大陸等公司,都對晶元有不同程度的涉足。這其中,大部分公司的晶元都只是涉及到終端的推斷(inference),而沒有涉足訓練(training),所以晶元設計比較簡單。

相反,國外的科技巨頭,比如谷歌/intel/nvidia/facebook等,都有涉足training的深度學習處理器的研發。

寒武紀是少數已經涉足training的中國企業。

dadiannao就是可以用於伺服器上進行大規模training的專用晶元。

看好寒武紀!

AI晶元 寒武紀PuDianNao結構分析

pudiannao 之前介紹了寒武紀的diannao和dadiannao,其實內部處理邏輯可以說是一樣的。這種架構,只能適用特定的演算法型別,比如深度學習 cnn,dnn,rnn 等。但是,深度學習只是機器學習中的某一類,整個機器學習,有很多其他種類的演算法,和深度學習的不太一樣,甚至經常用到除法等...

AI晶元 寒武紀ShiDianNao結構分析

shidiannao shidiannao的出現是寒武紀在深度學習處理器上細分領域的更加深入。前面介紹的diannao針對的是大部分的深度學習神經網路演算法,包括cnn和rnn等。目前比較火而且應用面非常廣的領域是計算機視覺,若在這個領域的演算法精度實現巨大突破,那麼,就將開啟廣闊的應用領域,能夠真...

AI晶元 寒武紀Cambricon X結構分析

cambricon x是針對稀疏係數的矩陣計算架構。深鑑科技的韓松等人的研究發現,可以將傳統的深度學習網路模型的許多權重係數去掉,甚至能去掉90 以上,而並不影響模型的計算精度。如下圖所示。目前的深度學習模型的權重係數太多,造成需要的乘法計算非常多,計算時間長,速度慢。相信,未來的模型會更加複雜,需...