CUDA第乙個程式優化(若干個執行緒)

2021-05-22 13:36:57 字數 1001 閱讀 3187

#include

#include

#include

#define total_num 50000

#define thread_num 500

bool cuda_initial(void)

else

printf("there is %d device beyond 1.0/n",device_count);

for(i=0;iif(cudasetdevice(i)==cudaerrorinvaliddevice)

return true;

}void generate_num(int *num,int data_num)

void start()

void stop()else

}virtual long gettimediff()=0;//返回時間差滴答數

virtual void printtimediff()=0;//列印出時間差

};class millisecondcounter:public timecounterelse

}void printtimediff()

};#ifdef __cudacc__

class microsecondcounter:public timecounterelse

}void printtimediff()

};#endif

/****************time test end ************************/

__global__ void square_sum(int *num,int num_of_num,int *result,clock_t *time)

printf("in cpu result is %d/n",result_in_cpu);

cudafree(gpudata);

cudafree(result);

cudafree(time);

return 0;

}

CUDA 第乙個CUDA程式 addVector

本文主要通過對兩個浮點陣列中的資料進行相加,並將其結果放入第三個陣列中。其演算法分別在cpu gpu上分別執行,並比較了所需時間,強烈感受到gpu的平行計算能力。這裡,每個陣列的元素大小為30000000個。include include include include for the cuda r...

cuda筆記 第乙個cuda程式

釋放gpu中的記憶體cudafree cuda函式的定義 global 定義在gpu上,可以在cpu上呼叫的函式 device 定義在gpu上,由gpu呼叫函式 host 在cpu上定義的函式,一般與 device 一起用 在gpu上開闢空間 cudamalloc devptr,byte size ...

CUDA程式設計(一)第乙個CUDA程式

cuda compute unified device architecture 是顯示卡廠商nvidia推出的運算平台。是一種通用平行計算架構,該架構使gpu能夠解決複雜的計算問題。說白了就是我們可以使用gpu來並行完成像神經網路 影象處理演算法這些在cpu上跑起來比較吃力的程式。通過gpu和高並...