MIC高效能計算程式設計指南閱讀筆記 第一章

2021-08-01 20:28:32 字數 755 閱讀 7498

mic(many integrated core)框架,是將多個核心整合到一起的處理器,系列還發代號為knights

mic框架具有更小的核心和更多的硬體執行緒,以及512位的向量單元。mic+cpu異構協同計算是基於x86框架的異構計算。

與其他技術相比的優勢劣勢:

smp有多個相同的處理機共享同一主存,由乙個作業系統控制。如多核電腦,多路伺服器。

共享記憶體,可以輕易使用多個計算核心,通常根據執行緒劃分任務。

集群由一組計算機通過網路鬆散整合。

處理器之間的連線速度較smp慢,但能輕易提供更大規模的並行處理器數量和其他硬體資源。

非共享記憶體結構,通常採用訊息傳遞方式進行程序級的並行。

gpgpu

利用處理圖形任務的圖形處理器來完成原本該有**處理器處理的通用計算任務。cuda框架使得gpgpu的程式設計容易起來。

cuda中核指sp,32個sp組成乙個sm(類似simd),乙個sm有兩個控制單元,因此16個核必須執行同一條指令。

micmic中乙個核可以看作乙個x86核心。mic變成可以最大限度地沿襲cpu上的並行程式。mic上乙個核心可以併發執行4個執行緒(稱作 硬體執行緒)

mic採用smp結構,以一致性共享快取為中心。使得mic可以使用傳統cpu的程式設計模型。

mic與gpgpu的比較

gpgpu的核心比較輕量級,執行緒在核上的切換速度可忽略不計,mic不行。

gpgpu適合並行度極高,分支較少的應用

mic適合並行度較高,邏輯較複雜的應用(即分支、迴圈較多)

CUDA程式設計指南閱讀筆記(四)

接上篇文章繼續寫。1 二進位制相容性 二進位制 是裝置相關的,使用nvcc編譯器編譯時,若指定 code選項,則會編譯產生目標裝置的二進位制cubin物件。例如,編譯時使用 code sm 13會產生適用於計算能力1.3的二進位制 二進位制 在cuda計算裝置上具有小版本的向前相容性,但是在大版本上...

CUDA程式設計指南閱讀筆記(六)

接上文。共享記憶體是cuda裝置中非常重要的乙個儲存區域,有效地使用共享記憶體可以充分利用cuda裝置的潛能,極大提公升程式效能。那麼,共享記憶體有哪些特點呢?1 共享記憶體 shared memory 是整合在gpu處理器晶元上的 on chip 因此相比於存在於視訊記憶體顆粒中的全域性記憶體 g...

CUDA程式設計指南閱讀筆記(六)

接上文。共享記憶體是cuda裝置中非常重要的乙個儲存區域,有效地使用共享記憶體可以充分利用cuda裝置的潛能,極大提公升程式效能。那麼,共享記憶體有哪些特點呢?1 共享記憶體 shared memory 是整合在gpu處理器晶元上的 on chip 因此相比於存在於視訊記憶體顆粒中的全域性記憶體 g...