深度學習的GPU型號和引數選擇

2021-10-07 02:40:26 字數 1510 閱讀 7676

關於深度學習的nvidia的gpu加速網路訓練引數效能測試

英偉達rtx 30系列已出,有預算的,建議直接30系列了

深度學習注重的引數有兩個,分別是視訊記憶體頻寬和單精度浮點計算能力(這裡不考慮雙精度浮點計算能力)

視訊記憶體頻寬計算涉及到的顯示卡引數:視訊記憶體位寬(位)、視訊記憶體頻率(mhz)

單精度浮點據算能力涉及到的顯示卡引數:顯示卡主頻(mhz)、cuda核心

下面介紹常見的幾種顯示卡引數:

顯示卡型號

視訊記憶體單精度計算能力

視訊記憶體頻寬

主頻xcuda核心數x2/1000 (tflops)

視訊記憶體位寬x視訊記憶體頻率/8/1000(gb/s)

1060

6g1.582x1280x2=4.05

192.2

1660ti

6g1.580x1536x2=4.85

2881070

8g1.566x1920x2=5.78

256.32

1070ti

8g1.607x2432x2=7.85

2561080

8g1.607x2560x2=8.23

3201080ti

11g1.480x3584x2=10.61484.4

2060

8g1.365x1920x2=5.24

3362070

8g1.410x2304x2=6.51

4482070 super

8g1.410x2560x2=7.22

4482080

8g1.515x2944x2=8.92

4482080 super

8g1.650x3072x2=11.65

4482080ti

11g1.350x4352x2=11.75

6163070

8g1.730x5888x2=20.40

4483080

10g1.71x8704x2=29.80

7603090

24g1.70x10496x2=35.70

936titan x (maxwell架構)

12g1.000x3072x2=6.14

336.6

titan x (pacsal架構)

12g1.418x3584x2=10.16

336.58

titan xp

>12g

1.582x3840x2=12.15

547.7

titan v

>12g

1.200x5120x2=15.36

652.8

執行相同的**所用時間對比,並不能完全依照上述單精度計算能力來對比速度

顯示卡型號

單精度計算力

測試結果

1080ti

10.61

165s

2070

6.51

194s

3070

20.40

154s

AI開發 深度學習如何選擇GPU?

機器推理在深度學習的影響下,準確性越來越高 速度越來越快。深度學習對人工智慧行業發展的貢獻巨大,這得益於現階段硬體計算能力的提公升 網際網路海量訓練資料的出現。本篇文章主要介紹深度學習過程中如何選擇合適的gpu顯示卡,如果你是深度學習新手,希望這篇文章對你有幫助。推理用到的硬體分兩種,一種是專業ai...

深度學習之選擇GPU或CPU方法

import os os.environ cuda device order pci bus id os.environ cuda visible devices 1 上邊表示使用第二塊gpu執行程式,如果要使用多塊,如第一塊和第三塊,可使用如下方法指定 os.environ cuda visibl...

深度學習GPU執行環境的檢視和設定

使用nvidia smi來查詢gpu資訊 nvidia smi是乙個命令列工具,可以幫助你管理操作gpu device,並且允許你查詢和更改device狀態。在windows命令提示符中輸入cd c program files nvidia corporation nvsmi,再輸入nvidia s...