記憶體對齊原理

相信絕大多數的人都了解記憶體對齊，對齊後效能高。但是其最最底層的原理是啥呢？有的人可能會說，因為快取記憶體的工作機制。讀者你很聰明，這是原因之一。但我今天想挖的是更底層一點的原理，讓我們去記憶體的物理構成裡找找答案！

乙個記憶體是由若干個黑色的記憶體顆粒構成的。每乙個記憶體顆粒叫做乙個chip。每個chip內部，是由8個bank組成的。其構造如下圖：

而每乙個bank是乙個二維平面上的矩陣，前面文章中我們說到過。矩陣中每乙個元素中都是儲存了1個位元組，也就是8個bit。

那麼對於我們在應用程式中記憶體中位址連續的8個位元組,例如0x0000-0x0007，是從位於bank上的呢？直觀感覺，應該是在第乙個bank上嗎？其實不是的，程式設計師視角看起來連續的位址0x0000-0x0007，實際上位8個bank中的，每乙個bank只儲存了乙個位元組。在物理上，他們並不連續。下圖很好地闡述了實際情況。

你可能想知道這是為什麼，原因是電路工作效率。記憶體中的8個bank是可以並行工作的。如果你想讀取址0x0000-0x0007，每個bank工作一次，拼起來就是你要的資料，io效率會比較高。但要存在乙個bank裡，那這個bank只能自己幹活。只能序列進行讀取，需要讀8次，這樣速度會慢很多。

所以，記憶體對齊最最底層的原因是記憶體的io是以8個位元組64bit為單位進行的。對於64位資料寬度的記憶體，假如cpu也是64位的cpu（現在的計算機基本都是這樣的），每次記憶體io獲取資料都是從同行同列的8個chip中各自讀取乙個位元組拼起來的。從記憶體的0位址開始，0-7位元組的資料可以一次io讀取出來，8-15位元組的資料也可以一次讀取出來。

換個例子，假如你指定要獲取的是0x0001-0x0008，也是8位元組，但是不是0開頭的，記憶體需要怎麼工作呢？沒有好辦法，記憶體只好先工作一次把0x0000-0x0007取出來，然後再把0x0008-0x0015取出來，把兩次的結果都返回給你。 cpu和記憶體io的硬體限制導致沒辦法一次跨在兩個資料寬度中間進行io。這樣你的應用程式就會變慢，算是計算機因為你不懂記憶體對齊而給你的一點點懲罰。

擴充套件2：其實在記憶體硬體層上，還有作業系統層。作業系統還管理了cpu的一級、二級、**快取。不知道你有沒有印象，我們前面的文章說過快取記憶體裡的cache line也是64位元組，它是記憶體io的整數倍，不會讓記憶體io浪費。

記憶體對齊原理

記憶體對齊記憶體對齊規則解釋記憶體對齊原理

記憶體對齊原理

C 中記憶體對齊原理及作用

記憶體對齊原理

記憶體對齊 記憶體對齊規則解釋 記憶體對齊原理

記憶體對齊原理

C 中記憶體對齊原理及作用

相關推薦

記憶體對齊記憶體對齊規則解釋記憶體對齊原理