智慧型AI計算晶元對比

2021-09-23 22:17:04 字數 1347 閱讀 4035

下面是本人接觸到的ai晶元,主要涉及華為、位元大陸-算豐、英偉達。其他還有寒武紀、地平線、瑞芯微等沒有接觸過就不對比了。

易開發性:位元大陸》英偉達》華為

效能:華為》英偉達》位元大陸(效能不是很好對比,每家實現的運算元效能有差異,不能單純對比tops)

算力記憶體

頻寬(gb/s)

解碼編碼

功耗備註

公升騰310

16tops int8

lpddr4x 8/4gb

h.264/h.265 16路1080p@30fpsjpeg 1080p@256fps

1路1080p@30fps

9.5w

caffe/tensorflow

atlas300

4x4tflops62tops@int8

lpddr4x 4x 8gb

h.264/h.265 4x 16路1080p@30fpsjpeg 4x 1080p@256fps

4路1080p@30fps

67whi3559a

4tops@int8-nnie+2tops@int8-dsp

lpddr4x 4gb

5w算豐bm1880終端晶元

1tops@int8(winograd算計可達2tops@int8)

lpddr4 最大4gb

2路1080p@30fpsfhd:1080p@75fps

2.5w

多框架支援caffe\onnx

算豐bm1682雲端晶元

3tflops

8路1080p@30fps

可堆疊多顆晶元

算豐sc1/sc1+

2tflops/4tflops

16/32gb

501顆bm1680/2顆

nvidia jetson tx2

1tflops4tops@int8

lpddr4x 8gb

d2d 35d2h/h2d 20

8路1080p@30fps

7.5w

實測bm1682 vs hi3559a(單nnie)網路有快有慢,並不是某個晶元一定快。

bm1682

hi3559a

yolov3_352x384

32.65ms

41.4ms12

4yolov3_288x320

19.31ms

33.74ms

61.17ms

mobilenetv2_288x320

3.16ms

mtcnn_16x56

0.246ms

0.193ms

cnn_48x168

0.649ms

3.75ms

算力的計算,AI晶元與其他晶元的區別

所謂的ai晶元,一般是指針對ai演算法的asic 專用晶元 傳統的cpu gpu都可以拿來執行ai演算法,但是速度慢,效能低,無法實際商用。比如,自動駕駛需要識別道路行人紅綠燈等狀況,但是如果是當前的cpu去算,那麼估計車翻到河裡了還沒發現前方是河,這是速度慢,時間就是生命。如果用gpu,的確速度要...

AI晶元 Google TPU分析

in datacenter performance analysis of a tensor processing unit tpu系列晶元已經廣泛應用於google的各種服務中,加速其神經網路運算,例如2015年alphago與李世石進行圍棋人機對戰中所用的就是tpu晶元。tpu1面向的是資料中心...

邊緣計算大熱 AI晶元站上風口

5g商用臨近,物聯網技術和產業鏈逐步成熟,邊緣計算有望成為下乙個風口。由於使用者的巨大計算需求和物聯網帶來的海量資料 邊緣計算的受歡迎程度在不斷提高。其中雲 ai技術和產業有深厚積累及前沿布局的平台型公司有望成為邊緣計算浪潮最大受益者。ai晶元或大放異彩。中國大陸目前有超 20 家企業投入 ai 晶...