CUDA npp運動檢測模組效能測試

2022-08-27 21:54:11 字數 2350 閱讀 8520

測試環境:

cpu:       intel(r)core(tm)i7-4790 cpu @3.6ghz

gpu:        nvidia geforce gtx960 *2  

作業系統:   windows 7 專業版 64位作業系統

記憶體:        安裝記憶體(ram)      16.0gb

視訊記憶體:        4g*2

測試指標

測試專案

單幀耗mean500p

gpu佔用率

視訊記憶體占用

unitm

cpu佔用率

記憶體占用

unitm

1080p

1 路9.23ms

98% / 0%

237 / 0

0%263

1080p

2 路9.05ms

98% / 98%

237 / 237

0-1%

5281080p

4 路18ms

99% / 99%

389 / 389

0-1%

5281080p

8 路35.5ms

99% / 99%

702 / 702

0-1%

5291080p

16路72.5ms

99% / 99%

1325 / 1325

0-1%

5201080p

24路109.5ms

99% / 99%

2339 /2339

0-1%

522720p

1 路4.27ms

96% / 0%

153/0

0%263

720p

2 路4.2ms

96% / 96%

153/153

0%528

720p

4 路8ms

99%/99%

225/225

0-1%

515720p

8 路16ms

99%/99%

370/370

0-1%

519720p

16路32ms

99%/99%

661/661

0-1%

520720p

32路65ms

99%/99%

1243/1243

0-1%

5234cif

1 路2.1ms

90%-90%

121 / 0

0-1%

3414cif

2 路2ms

91% / 91%

121 / 121

0-1%

5184cif

4 路3.5ms

99% / 99%

162 / 162

0-1%

5194cif

8 路7ms

99% / 99%

244 / 244

0-1%

5194cif

16路14ms

99% / 99%

408 / 408

0-1%

5214cif

32路28.5ms

96% / 96%

737 / 737

0-1%

5244cif

64路102ms

55% / 55%

1394 / 1394

0-1%

529注: 1. 上述測試的每一路對應主機程式的乙個執行緒。

2. 上述的所有測試不考慮主機和記憶體之間的資料拷貝,單純的測試gpu的計算能力

所以cpu基本處於空閒狀態。

分析:1. 隨著主機執行緒數目的增多,執行緒之間的排程時間延時會導致gpu佔用率下降

2. 比較此前測試的gtx760顯示卡, gtx960的計算能力略弱,但多執行緒能力稍強。

OpenCV 物體運動檢測

安裝各種環境 學習背景分割 二值化 膨脹 腐蝕等操作。原始碼 usr bin env python 汽車運動檢測 p140 import cv2 import os import numpy as np cap cv2.videocapture 1 cap cv2.videocapture 0 調取...

混合高斯運動檢測筆記

include include include include opencv2 video background segm.hpp include opencv2 legacy blobtrack.hpp include opencv2 legacy legacy.hpp include openc...

python opencv3 運動檢測

git 思路 開啟攝像頭後 設定乙個當前幀為背景,在之後檢測到的幀都與背景對比不同,對不同的地方進行檢測 1 coding utf 823 4 計算幀之間的差異 考慮背景幀與其他幀之間的差異 5 67 import cv28 import numpy as np910 呼叫攝像頭 11 camera...