C語言記憶體位址對齊詳解

2022-08-24 09:54:11 字數 3159 閱讀 4940

什麼是位址對齊?

現代計算機中記憶體空間都是按照位元組(byte)劃分的,從理論上講似乎對任何型別的變數的訪問可以從任何位址開始,但實際情況是在訪問特定變數的時候經常在特定的記憶體位址訪問,這就需要各型別資料按照一定的規則在空間上排列,而不是順序的乙個接乙個的排列,這就是對齊。

為什麼要位址對齊?

對齊的作用和原因:各個硬體平台對儲存空間的處理上有很大的不同。一些平台對某些特定的型別的資料只能從某些特定的位址開始訪問。其它平台可能沒有這些限制,但是最常見是的如果不按照適合其平台的要求對資料儲存進行對齊,會在訪問效率上帶來損失。比如有些平台每次讀都是從偶數字址開始,如果乙個 int 型(假設是 32 位)如果存放在偶數字址開始的地方,那麼乙個時鐘週期就可以讀出。而如果是存放在乙個奇數字址開始的地方,就可能會需要 2 個時鐘週期,並對兩次讀出的結果的高低位元組進行拼湊才能得到該 int 型資料。顯然在讀取效率上下降很多。這也是空間和時間的博弈。

對齊的實現

通常,我們寫程式的時候,不需要考慮對齊的問題。編譯器會替我們選擇適合目標平台的對齊策略。當然,我們也可以通知給編譯器傳遞預編譯指令而改變指定資料的對齊方式。

但是,正因為我們一般不需要關心這個問題,又因為編譯器對資料做了對齊處理。但我們不了解的話,常常會對一些問題感到迷惑。最常見的就是結構體(struct)的 sizeof() 結果,出乎意料。為此,我們需要對對齊演算法有所了解。

對齊演算法

由於各個平台和編譯器的不同,現以本人使用的 gcc version 3.2.2 編譯器(32 位 x86 平台)為例子,來討論編譯器對 struct 的各個成員如何進行對齊的。

假設結構體定義如下:

struct a

;

結構體中包含了長度為 4 位元組的 int 型變數乙個,長度為 1 位元組的 char 型變數乙個,長度為 2 位元組的 short 型變數乙個。所以 struct a 的長度應該是 4 + 1 + 2 = 7,但是因為編譯器要對成員在空間上進行對齊,所以使用 sizeof(a) 值為 8。

現在我們把結構體的成員順序調整一下:

struct a

;

調整後的 struct a 的長度應該還是 7,但是 sizeof(a) 的值卻是 12。

下面我們使用下面的預編譯指令來告訴編譯器,使用我們指定的對齊值 2 來取代預設值。

#pragma pack(value)

#pragma pack(2) /* 指定對齊值為 2 */

struct a

;#pragma pack() /* 取消指定對齊值,使用預設值。 */

這時的 sizeof(a) 值為 8。

修改對齊值為 1:

#pragma pack(1) /* 指定對齊值為 1 */

struct a

;#pragma pack() /* 取消指定對齊值,使用預設值。 */

sizeof(a) 值為 7。

下面我們就來詳解這些都是為什麼?

先了解四個概念:

基本資料型別自身的對齊值:就是基本資料的長度,如 sizeof(char)、sizeof(int)、sizeof(short)。

指定的對齊值:使用 #pragma pack(value) 指令指定的值。

匯出資料型別的自身對齊值:其成員中自身對齊值最大的那個值。

匯出資料型別的有效對齊值:其自身對齊值和指定對齊值是較小的。

有了這些值,我們就可以很方便的來討論具體資料結構的成員和其自身的對齊方式。有效對齊值n是最終用來決定資料存放位址方式的值,最重要。有效對齊n,就是表示「對齊在n上」,也就是說該資料的」存放起始位址%n=0″.而資料結構中的資料變數都是按定義的先後順序來排放的。第乙個資料變數的起始位址就是資料結構的起始位址。結構體的成員變數要對齊排放,結構體本身也要根據自身的有效對齊值圓整(就是結構體成員變數占用總長度需要是對結構體有效對齊值的整數倍,結合下面例子理解)。這樣就不難理解上面的幾個例子的值了。

分析例子b:

struct b

;

假設b從位址空間0×0000開始排放。該例子中沒有定義指定對齊值,在筆者環境下,該值預設為4。第乙個成員變數b的自身對齊值是1,比指定或者預設指定對齊值4小,所以其有效對齊值為1,所以其存放位址0×0000符合0×0000%1=0.第二個成員變數a,其自身對齊值為4,所以有效對齊值也為4,所以只能存放在起始位址為0×0004到0×0007這四個連續的位元組空間中,複核0×0004%4=0,且緊靠第乙個變數。第三個變數c,自身對齊值為2,所以有效對齊值也是2,可以存放在0×0008到0×0009這兩個位元組空間中,符合0×0008%2=0。所以從0×0000到0×0009存放的都是b內容。再看資料結構b的自身對齊值為其變數中最大對齊值(這裡是b)所以就是4,所以結構體的有效對齊值也是4。根據結構體圓整的要求,0×0009到0×0000=10位元組,(10+2)%4=0。所以0x0000a到0x000b也為結構體b所占用。故b從0×0000到0x000b共有12個位元組,sizeof(struct b)=12;

同理,分析上面例子c:

#pragma pack(2) /*指定按2位元組對齊*/

struct c

;#pragma pack() /*取消指定對齊,恢復預設對齊*/

第乙個變數b的自身對齊值為1,指定對齊值為2,所以,其有效對齊值為1,假設c從0×0000開始,那麼b存放在0×0000,符合0×0000%1=0;第二個變數,自身對齊值為4,指定對齊值為2,所以有效對齊值為2,所以順序存放在0×0002、0×0003、0×0004、0×0005四個連續位元組中,符合0×0002%2=0。第三個變數c的自身對齊值為2,所以有效對齊值為2,順序存放在0×0006、0×0007中,符合0×0006%2=0。所以從0×0000到0×00007共八字節存放的是c的變數。又c的自身對齊值為4,所以c的有效對齊值為2。又8%2=0,c只占用0×0000到0×0007的八個位元組。所以sizeof(struct c)=8.

有了以上的解釋,相信你對c語言的位元組對齊概念應該有了清楚的認識了吧。在網路程式中,掌握這個概念可是很重要的喔,在不同平台之間(比如在windows 和linux之間)傳遞2進製流(比如結構體),那麼在這兩個平台間必須要定義相同的對齊方式,不然莫名其妙的出了一些錯,可是很難排查的哦^_^。

from:

記憶體位址對齊

記憶體位址對齊,是一種在計算機記憶體中排列資料 訪問資料的一種方式,包含了兩種相互獨立又相互關聯的部分 基本資料對齊和結構體資料對齊。當今的計算機在計算機記憶體中讀寫資料時都是按字 word 大小塊來進行操作的 在32位系統中,資料匯流排寬度為32,每次能讀取4位元組,位址匯流排寬度為32,因此最大...

C 位元組對齊(記憶體位址對齊)

現代計算機中記憶體空間都是按照byte劃分的,從理論上講似乎對任何型別的變數的訪問可以從任何位址開始,但實際情況是在訪問特定型別變數的時候經常在特 定的記憶體位址訪問,這就需要各種型別資料按照一定的規則在空間上排列,而不是順序的乙個接乙個的排放,這就是對齊。對齊的作用和原因 各個硬體平台對儲存空間的...

記憶體位址的對齊

3 有 pragma pack int 進行設定,如果結構體某成員的sizeof大於你設定的,則按你的設定來對齊 注意 每次用 pragma pack int 進行設定後,要用 pragma pack 對其結束,免得造成錯誤 view plain copy to clipboard print in...