NVIDIA V100 GPU 效能測試資料

2021-08-14 02:23:47 字數 2154 閱讀 1950

1. 常用2u 伺服器配備有8張nvidia tesla  v100 gpu卡,效能測試結果說明:

如果你具有一台伺服器,並且購買了超強計算能力的gpu卡,那麼恭喜你,可以進行一次關於計算機超萬億次計算能力的體驗。

接下來是您要做的:

我們來說說cuda包是幹嘛的,首先大家都知道,驅動,就是對應硬體裝置的使能軟體,那麼為什麼又需要cuda這個東西呢。

因為我們要使用gpu的話,是為了把應用程式跑到gpu上面,那麼,就只能通過nvidia他自己提供的api,以及lib庫,來使用它的gpu。

可以看到下面這張圖,從下至上,從屋裡裝置到應用加速,其中涉及的很多中介軟體。

安裝完成之後,

使用 nvidia-,按tab,來檢視nvidia相關的一些相關命令,

nvidia-smi: 而其中最常用的就是nvidia-smi 這個命令,可以檢視一下幫助文件。這個命令會列印每張卡的溫度,記憶體利用,gpu利用率,功耗,執行的任務,等等。

note:如果您沒有發現該命令,  請確認,是否使用了yum localinstall *.rpm 進行了本地安裝,提示安裝完成了,但在此之後,並沒有把很多相關依賴的包進行安裝,進入

/etc/yum.repos.d/ 目錄,此時,多了乙個yum源的配置檔案,叫cuda***,檢視內容,會發現,它指向了/var/路徑,進入到此路徑之後,發現會有一大批的包沒有安裝,

此時,把所有的包都進行安裝,才是安裝完成。

要進行測試的話,其實很簡單,cuda它本身提供了很多的sample程式,並且其中的乙個cublas,也是用來進行測試gpu計算能力的程式。

當然,你也可以對這些程式進行參考,寫自己的程式。

下面我們來跑乙個例子,進入到目錄:/usr/local/cuda-9.0/samples/5_simulations/

可以看到,其中有乙個nbody程式的資料夾,

這個程式,是對物理學中n個質子,說白了就是n個物體,進行互相之間的萬有引力計算,會涉及很對大量的單雙精度浮點的計算,該程式就是實現了這個計算過程,並且呼叫了gpu,還可以讓使用者通過命令列引數,來控制程式執行的過程。

cd ./nbody  進入到該資料夾。

make

執行:./nbody -benchmark 

。此時可以看到程式執行了,並且會列印出來一些可選的引數,如果要使用8個卡均執行的話,那就在linux上面執行8個程序,每個程序分別繫結到單卡即可。

具體值如下:

9958.723

9942.739

9919.522

9852.494

9757.071

9717.97

9670.115

9592.821

根據官方提供的10.6tflops的理論效能值,以及官網描述的能夠達到80%的實際測量值即可,可知,這些測量資料,是效能幾乎接近了理論值,達到了94%的效能。

接下來會寫一篇關於gpu 卡直通的部落格,歡迎繼續關注。

今天在裝了乙個boost等一堆rpm包之後,

gpu的效能已經跑到了標準值。

結果如下:

= 10426.414 single-precision gflop/s at 20 flops per interaction

= 10417.990 single-precision gflop/s at 20 flops per interaction

= 10424.031 single-precision gflop/s at 20 flops per interaction

= 10413.620 single-precision gflop/s at 20 flops per interaction

= 10415.790 single-precision gflop/s at 20 flops per interaction

= 10408.605 single-precision gflop/s at 20 flops per interaction

= 10400.214 single-precision gflop/s at 20 flops per interaction

= 10392.723 single-precision gflop/s at 20 flops per interaction

GPU效能 Overdraw功能

overdraw功能 總填充數峰值 專案執行過程中,單幀總填充畫素數量的最大值 m表示百萬,20m就是說有一幀內填充了 2000 萬個畫素 填充倍數峰值 專案執行過程中,單幀的最大填充倍數。10.0x相當於在這一幀螢幕重新整理了 10遍 單幀填充倍數 該幀總填充數 該幀渲染相機的解析度 需要注意的地...

GPU效能優化,One Step!

overdraw 該模組可以幫助使用者直接檢視專案執行時每幀都渲染的畫素數量,從而反映出裝置gpu端所承受的壓力。我們可以看到下面的中有地方是黑色,有地方是紅色。顏色越紅,表示該處畫素在當前幀中被填充的次數較多,進而gpu的壓力也就越大。移動vr開發者需要特別關注這部分的情況。下圖是效能檢測報告中的...

kafka效能測試1 0 0

kafka提供工具kafka producer perf test.sh用以壓測,引數說明 messages 生產者傳送總的訊息數量 message size 每條訊息大小 batch size 每次批量傳送訊息的數量 topics 生產者傳送的topic threads 生產者使用幾個執行緒同時傳...