GPU 程式設計 global memory 的使用

2022-08-20 02:18:10 字數 583 閱讀 4320

最近做作業,發現了乙個一直不理解的問題終於明白了,高興!

block只是用來劃分task。

block和device memory 訪問沒有對應關係。 block可以訪問任一device memory的內容。 之前,以為block只能訪問劃分給它的那塊資料!!

比如以前提過的兩矩陣乘法, 矩陣小塊可以除了訪問該矩陣小塊對應的device memory,還訪問了同一列分割槽和同一行分割槽的 device memory。

但是,block在寫device memory的時候,就需要注意了!

總之:block 的任務 劃分  和 device memory 的資料布局有很大的關係。 

如果device memory 的資料布局好,任務劃分的時候,訪問資料、寫資料都比較容易。有時候,就是根據資料布局來進行任務劃分的。

block可以訪問任一資料。 計算 index的目的是用來明白自己是第幾個thread,該thread的任務是什麼!!

share_memory 的使用非常關鍵!!

還需要更多地看gpu 程式設計例子,思考 自己的程式設計想法,再看樣例 (這樣比自己程式設計實現省時間。想起了當初學c++的時候,練習冊裡的例子是看完了的)

GPU程式設計例項

gpu是多核技術的代表之一,在一塊晶元上整合多個較低功耗的核心,單個核心頻率基本不變,一般在1 3ghz,設計重心轉向到多核的整合技術,gpu是一種特殊的多核處理器。本文在聯想深騰7000g gpu集群上進行實驗,該集群有100個節點,每個節點包含兩個4核cpu intel xeon 16gb記憶體...

GPU程式設計模型

gpu graphical processing unit 是顯示卡內用於圖形處理的器件。和cpu相比,cpu是序列執行,而gpu是多個核並行執行。gpu是乙個高效能的多核處理器,有很高的計算速度和資料吞吐率。在gpu上的運算能獲得相對於cpu而言很高的加速比。第 一 第二代gpu出現的時候,gpu...

GPU程式設計筆記(2)

2009 02 02 19 52 高階渲染語言基礎 1 hlsl語法與c語法非常類似。2 資料型別 bool int 32位signed half 16位float float 32位float double 64位float 3 變數宣告 與c一樣 4 型別修飾 可以使用const,與c 一樣 r...