cuda學習筆記1 hello world實戰

2021-09-25 14:43:52 字數 1424 閱讀 3870

因為要用tensorrt寫自定義層,一定會用到cuda,所以學一下。

– – fuc.cu

fuc.h

test.cu

cmakelists.txt

#include #include "fuc.h"

__global__ void kernel()

extern __global__ void kernel();
#include #include "fuc.h"

int main(void)

cmake_minimum_required(version 2.8)

project(helloworld c cxx)

# find_package()命令首先會在模組路徑中尋找 find.cmake,這是查詢庫的乙個典型方式

# quiet 可選字段,表示如果查詢失敗,不會在螢幕進行輸出(但是如果指定了required欄位,則quiet無效,仍然會輸出查詢失敗提示語)

find_package(cuda quiet required)

# 下面這行注釋掉的**和上面那行**起到一樣的作用

# include(/usr/share/cmake-3.5/modules/findcuda.cmake)

set(cuda_include_dirs /usr/local/a-9.0/include)

set(cuda_library_dirs /usr/local/cuda-9.0/lib64)

include_directories($)

link_directories($)

cuda_add_executable(helloworld test.cu fuc.cu)

cmake_minimum_required(version 2.8)

project(helloworld c cxx)

find_package(cuda quiet required)

set(cuda_include_dirs /usr/local/a-9.0/include)

set(cuda_library_dirs /usr/local/cuda-9.0/lib64)

include_directories($)

link_directories($)

# 原:

# cuda_add_executable(helloworld test.cu fuc.cu)

# 改為以下兩行:

file(glob_recurse current_include ./*.h ./*.hpp ./*.cuh)

cuda_add_executable(cuda_test $)

cuda學習筆記 1

cuda cu 的目的是並行運算。只要在c c 中呼叫以 global 為關鍵字修飾的函式 global void function type inputarraya,type inputarrayb,type outputarraya 稱為核函式,經nvcc編譯,識別到核函式就會編譯成gpu指令碼...

CUDA學習筆記(1) Hello CUDA

cuda的安裝網上的教程有很多,這裡就不做介紹了。cuda使用c語言的語法,擴充套件了一些關鍵字,下面我們使用cuda編寫第乙個程式hello cuda。這裡使用vs 2015新建乙個cuda的專案,在新建專案中,選擇cuda,如下圖顯示 程式 如下 include cuda runtime.h i...

CUDA學習備忘1

一 cuda流程 1設定可用裝置 cudasetdevice 2在gpu上申請資料記憶體 cudamalloc 3將host cpu 資料複製到device gpu cudamemcpy 4呼叫kernel,kernel dg grid db block ns 共享記憶體 s 流5根據情況同步執行緒...