深度學習的GPU型號和引數選擇

關於深度學習的nvidia的gpu加速網路訓練引數效能測試

英偉達rtx 30系列已出，有預算的，建議直接30系列了

深度學習注重的引數有兩個，分別是視訊記憶體頻寬和單精度浮點計算能力（這裡不考慮雙精度浮點計算能力）

視訊記憶體頻寬計算涉及到的顯示卡引數：視訊記憶體位寬（位）、視訊記憶體頻率（mhz）

單精度浮點據算能力涉及到的顯示卡引數：顯示卡主頻（mhz）、cuda核心

下面介紹常見的幾種顯示卡引數：

顯示卡型號

視訊記憶體單精度計算能力

視訊記憶體頻寬

主頻xcuda核心數x2/1000 (tflops)

視訊記憶體位寬x視訊記憶體頻率/8/1000(gb/s)

1060

6g1.582x1280x2=4.05

192.2

1660ti

6g1.580x1536x2=4.85

2881070

8g1.566x1920x2=5.78

256.32

1070ti

8g1.607x2432x2=7.85

2561080

8g1.607x2560x2=8.23

3201080ti

11g1.480x3584x2=10.61484.4

2060

8g1.365x1920x2=5.24

3362070

8g1.410x2304x2=6.51

4482070 super

8g1.410x2560x2=7.22

4482080

8g1.515x2944x2=8.92

4482080 super

8g1.650x3072x2=11.65

4482080ti

11g1.350x4352x2=11.75

6163070

8g1.730x5888x2=20.40

4483080

10g1.71x8704x2=29.80

7603090

24g1.70x10496x2=35.70

936titan x (maxwell架構)

12g1.000x3072x2=6.14

336.6

titan x (pacsal架構)

12g1.418x3584x2=10.16

336.58

titan xp

>12g

1.582x3840x2=12.15

547.7

titan v

>12g

1.200x5120x2=15.36

652.8

執行相同的**所用時間對比，並不能完全依照上述單精度計算能力來對比速度

顯示卡型號

單精度計算力

測試結果

1080ti

10.61

165s

2070

6.51

194s

3070

20.40

154s

AI開發深度學習如何選擇GPU？

機器推理在深度學習的影響下，準確性越來越高速度越來越快。深度學習對人工智慧行業發展的貢獻巨大，這得益於現階段硬體計算能力的提公升網際網路海量訓練資料的出現。本篇文章主要介紹深度學習過程中如何選擇合適的gpu顯示卡，如果你是深度學習新手，希望這篇文章對你有幫助。推理用到的硬體分兩種，一種是專業ai...

深度學習之選擇GPU或CPU方法

import os os.environ cuda device order pci bus id os.environ cuda visible devices 1 上邊表示使用第二塊gpu執行程式，如果要使用多塊，如第一塊和第三塊，可使用如下方法指定 os.environ cuda visibl...

深度學習GPU執行環境的檢視和設定

使用nvidia smi來查詢gpu資訊 nvidia smi是乙個命令列工具，可以幫助你管理操作gpu device，並且允許你查詢和更改device狀態。在windows命令提示符中輸入cd c program files nvidia corporation nvsmi，再輸入nvidia s...

深度學習的GPU型號和引數選擇

AI開發 深度學習如何選擇GPU？

深度學習之選擇GPU或CPU方法

深度學習GPU執行環境的檢視和設定

相關推薦

AI開發深度學習如何選擇GPU？