C 記憶體對齊詳解

最近看各公司筆試和面試的試題，不少是關於c++記憶體對齊方面的。這個問題我以前也模模糊糊的了解一些，但總是不甚清楚。這次費了很大勁，終於算是搞明白了。整理出來，和大家分享一下。

這一切要從機器字長和儲存字長說起。機器字長是cpu每次處理的二進位制的位數；儲存字長是記憶體中乙個儲存單元的包含二進位制位數，或一次記憶體讀寫操作的位數，也可以理解成資料線的根數。

下面以機器字長和儲存字長都是32位的機器為例，來說明為什麼要記憶體對齊。我們知道記憶體是以位元組（byte）來編址的，32位也就是4個位元組。由於記憶體的讀寫單位是儲存單元，所以cpu對記憶體進行讀寫時，傳送給它的位址必須是儲存單元長度的倍數，即儲存字長的倍數。我們這裡的儲存字長是4 bytes，所以這個位址必須是4n。假設現有乙個大小為4 bytes的int型別的值，如不考慮對齊，它在記憶體中的儲存有以下4種情況：

圖 1

case 1時，處理器只需要讀乙個儲存單元，就可以直接得到int值； case 2、3、4時，就需要讀取兩個記憶體單元，並且要經過一系列處理後才能得到所需的值，這種情況下效率是很低的。而這種糟糕情況，對於int型別來說，發生的概率是75%。若果不對齊，cpu對記憶體的讀寫是很低效的。

在討論對齊規則之前，先把我用來測試的環境說一下。編譯器vc6.0，作業系統win7，機器字長、儲存字長32(4bytes)。此環境下基本資料的大小為：sizeof(char)=1;sizeof(short)=2; sizeof(int)=4; sizeof(double)=8。

設儲存字長為w bytes，機器字長不小於w。根據前面的分析，我們從記憶體訪問的效率出發，很容易得到乙個原則：每個基本資料型別t訪問時，訪問的儲存單元的個數應為ceiling(sizeof(t)/w)，而不應超出此值。這就是記憶體對齊的基本原則。在進一步討論之前，我們先引入乙個概念：對齊大小。對於基本資料型別而言，對齊大小是sizeof的返回值；而對於復合型別，則是其資料成員中最大的對齊大小的值，sizeof的返回值是它的儲存大小。比如：

struct t
;

t的對齊大小為sizeof(int)=4,儲存大小是2*4=8。

以下是記憶體對其的規則，

規則二：復合型別的的儲存大小為其對齊大小的整數倍。

規則三：復合型別包含復合型別的時候，子結構按乙個整體對待，儲存大小不變。

在基本資料型別的大小都是2整數冪的前提下，這個規則滿足基本原則的要求。幸運的是c++的基本資料型別確實全都是2的整數冪（bool型別的提公升為乙個位元組處理），vc6.0在預設情況下，也確實用的這一規則。這乙個規則的好處是，不必關心儲存字長w，就可以滿足16、32、64乃至128位儲存字長下，記憶體對齊的要求。以下通過例子進行說明。

例1.

#includeusing std::cout;
using std::endl;
struct a
;int main()
;b testb;
cout執行結果：
型別b和例1中的a其實是一樣的，只是改變了內部元素的宣告順序，得到的結果便發生了改變，最明顯的就是它節省了4 bytes。根據輸出資訊，我們得到b的資料在記憶體中存放的示意圖：
圖 3 
根據規則一，把資料元素排列後，用去8 bytes。這個大小正好滿足規則二，也就不再需要補充了，所以b的儲存大小是8 bytes。
例 3.
struct c
;c testc;
cout資料在記憶體中存放的示意圖：
圖 4 
與以上例子一樣，先根據規則一將資料安排好，由於此結構中最大元素doubleb的大小為8 bytes，按8的倍數補齊，c的大小即為32 bytes。不過仔細一數，發現實際用到的位元組數只有15 bytes，而浪費掉的卻有17 bytes之多。現在記憶體容量都比較大，也許不需要太計較，但作為乙個以勤儉節約為傳統美德的民族的子民，看到這耀眼的空白，總有點誠惶誠恐的感覺。根據結構a和b的經驗，我們調整一下結構。
例4.struct d
;d testd;
cout資料在記憶體中存放的示意圖：
圖5與圖4相比，這個是不是看上去好了很多。不錯，它確實節省了一半的記憶體。通過這幾個例子我們可以得到乙個經驗，在設計新復合型別的時候，我們應盡量把相同型別的資料放在一塊；不同型別的資料之間按儲存大小遞增或遞減的方式排列，這樣就可以保證大多數情況下浪費的空間最少。
下面說說結構中包含結構的情況。
例5.struct suba
;struct subb 
;suba testsuba;
subb testsubb;
cout<
由此可到suba和subb的資料在記憶體中的示意圖：
圖 6在此基礎上定義
struct e 
;e teste;
cout<
圖 7可以看出，給e分配儲存空間時，先在0位置安放suba a，占去了6 bytes。接下來安排char b和int c，在安排subb之前共用去了12 bytes。根據規則三，subb按整體對待。由於它的對齊大小是8，起始位址必須是8n，於是跳過4bytes在位置16安放，占去sizeof(subb)=16個位元組。至此，e占用了32bytes， e的對齊大小等於subb的對齊大小為8，32=4*8，滿足規則二，不需要補齊，這就得到了e的儲存大小32bytes。 
到這裡，vc6.0的預設對齊方式就算說完了。也許你發現，subb的儲存浪費了將近50%的記憶體，而我們也確實沒辦法進一步優化它。如果你的程式注重空間而不太要求效率的話，這確實會讓你很難受。幸運的是，好的編譯器總會提供你更多的選擇。預編譯命令#pragma pack(n)可以幫你解決這一問題，它允許你設定資料的對齊大小。編譯器建議你這個n值取2的整數冪，不然它會給你乙個警告，然後不理你的設定。即便按要求設定了n，編譯器也不一定會用，它真正使用的值是，你設定的n和型別預設對齊大小中較小的乙個，即min。是不是看著很繞，沒關係，先看個例子。
例6.#includeusing std::cout;
using std::endl;
#pragma pack(2)//語句1
struct f
;int main()
=2，所以int的對齊大小為2，因為位置2滿足了規則一，所以可以在此儲存b。然後分配char，min=1，也就是說char的對齊大小沒有改變，直接儲存就行，最後補成2的倍數，便得sizeof(f)=8.
ok，這就我理解的全部內容。鑑於本人水平有限，且對底層不甚了解，文中難免出現這樣那樣的錯誤，還望高手雅正。

C 記憶體對齊詳解

詳解C語言記憶體對齊

c語言記憶體對齊詳解

記憶體對齊詳解

C 記憶體對齊詳解

詳解C語言記憶體對齊

c語言記憶體對齊詳解

記憶體對齊詳解

相關推薦