累加計算的並行與序列效率比較

2021-09-01 13:31:17 字數 435 閱讀 3086

計算一幅影象的畫素值的平均值

測試環境:

cpu: intel(r)_core(tm)_i7-7700_cpu_@_3.60ghz

x 8gpu: nvidia geforce gtx 1050

1,在cuda gpu上計算累加和,先分段計算,在進行規約,分段計算裡面其實也是規約,然後除以總的畫素個數。

2,在cpu上序列計算累加和,再除以總的畫素個數。

3,在cpu上使用omp進行並行化。

對於1024x1024大小的影象資料,在保證結果正確一致的前提下,比較計算耗時,結果如下:

可以看出,最快的是cuda gpu,其次是omp並行化之後的程式,最慢的是序列計算。

**可參考:

序列IO與並行IO的效率比較

mpi file read at函式與c語言中的fread函式,依次讀取乙個100m的檔案,讀取時間如下所示 實驗一 zhangyang mpi002 kmeans exper mpiexec np 1 mpi c fspeed there are 1500015 samples.start tes...

序列計算機與平行計算 併發計算的比較

原文 從序列到並行,從並行到分布式 假設有ab兩個任務,則序列 並行 併發的區別如圖1所示。序列 a和b兩個任務執行在乙個cpu執行緒上,在a任務執行完之前不可以執行b。即,在整個程式的執行過程中,僅存在乙個執行上下文,即乙個呼叫棧乙個堆。程式會按順序執行每個指令。並行 並行性指兩個或兩個以上事件或...

序列 並行程式在效率上的簡單比較

分類 multi x 2010 10 15 10 33 1198人閱讀 收藏舉報 parallel 工作程式開發 作業語言測試 開頭 這是老師在開學時布置的一道作業題目,完整問題為 多核與單核的cpu在執行序列 並行程式時時,在效率上的差別。以前雖然常常聽說多核,但是卻沒有去多了解下並行程式和序列程...