第1個CUDA程式

2021-06-29 11:50:25 字數 692 閱讀 2200

vs2013+cuda6.5編譯環境搭建

1.      安裝vs2013

2.      安裝cuda6.5

可能遇到的問題:缺少intel的驅動,vs版本太低

建立第1個cuda程式:

1.      建立win32空專案

2.      新增依賴項

3.      開啟專案屬性頁

4.      開啟配置屬性中的vc++目錄,在包含目錄中加入$(cuda_inc_path)

7.      建立c++空專案,取名為firstcuda.cu

#include

#include

__global__

void add(int

a, int

b, int *c)

int main(){

int c;

int *dev_c;

cudamalloc((void **)&dev_c, sizeof(int));

add<<< 1, 1 >>>(2, 7,dev_c);

cudamemcpy(&c, dev_c, sizeof(int), cudamemcpydevicetohost);

printf("2 + 7 =%d\n",c);

cudafree(dev_c);

return 0;

9.編譯後執行結果如下

CUDA 程式的優化 1 概述

cuda程式優化的最終目的,是以最短的時間,在允許的誤差範圍內完成給定的計算任務。在這裡,最短的時間 是指整個程式的執行時間,更側重於計算的吞吐量,而不是單個資料的延遲。在開始考慮使用gpu和cpu協同計算之前,應該先粗略地評估使用cuda是否能達到預想的效果,包括以下幾個方面 1.精度 目前,gp...

CUDA 第乙個CUDA程式 addVector

本文主要通過對兩個浮點陣列中的資料進行相加,並將其結果放入第三個陣列中。其演算法分別在cpu gpu上分別執行,並比較了所需時間,強烈感受到gpu的平行計算能力。這裡,每個陣列的元素大小為30000000個。include include include include for the cuda r...

cuda筆記 第乙個cuda程式

釋放gpu中的記憶體cudafree cuda函式的定義 global 定義在gpu上,可以在cpu上呼叫的函式 device 定義在gpu上,由gpu呼叫函式 host 在cpu上定義的函式,一般與 device 一起用 在gpu上開闢空間 cudamalloc devptr,byte size ...