CUDA實戰 第乙個樣例程式

2021-07-23 11:32:48 字數 474 閱讀 6684

這兩天開始看《gpu高效能程式設計cuda實戰》這本書,學到的東西稍稍在部落格做個記錄。

使用cuda c程式設計的話,當然首先需要有個支援cuda的gpu,市面上很多gpu都已經支援cuda,之後需要為gpu安裝cuda驅動程式,我使用的是ubuntu系統,安裝方法在這篇部落格 cuda7.5 安裝 中有提到,可作參考,當然也要安裝個gcc、g++(自己習慣用c++)編譯器,這個就不說了。

根據書上的內容,寫了第乙個cuda程式,**檔名為cuda.cu,**如下:

__global__ void add(int a, int b, int *c)//kernel函式,在gpu上執行。

int main()

然後進行編譯:nvcc cuda.cu -o cuda

生成名為cuda的可執行檔案

之後執行:./cuda

執行結果:2 +  7 =  9

CUDA 第乙個CUDA程式 addVector

本文主要通過對兩個浮點陣列中的資料進行相加,並將其結果放入第三個陣列中。其演算法分別在cpu gpu上分別執行,並比較了所需時間,強烈感受到gpu的平行計算能力。這裡,每個陣列的元素大小為30000000個。include include include include for the cuda r...

cuda筆記 第乙個cuda程式

釋放gpu中的記憶體cudafree cuda函式的定義 global 定義在gpu上,可以在cpu上呼叫的函式 device 定義在gpu上,由gpu呼叫函式 host 在cpu上定義的函式,一般與 device 一起用 在gpu上開闢空間 cudamalloc devptr,byte size ...

CUDA程式設計(一)第乙個CUDA程式

cuda compute unified device architecture 是顯示卡廠商nvidia推出的運算平台。是一種通用平行計算架構,該架構使gpu能夠解決複雜的計算問題。說白了就是我們可以使用gpu來並行完成像神經網路 影象處理演算法這些在cpu上跑起來比較吃力的程式。通過gpu和高並...