C C 中的對齊

2021-07-31 10:50:01 字數 4495 閱讀 4848

對於記憶體要求高的程式,要有效控制資料結構的大小,熟悉對齊規則是必要的。在開始寫乙個結構體之前,按照長度大小順序來寫成員是乙個需要記住的技巧。

許多實際的計算機系統對基本型別資料在記憶體中存放的位置有限制,它們會要求這些資料的首位址的值是某個數k(通常它為4或8)的倍數,這就是所謂的記憶體對齊,而這個k則被稱為該資料型別的對齊模數(alignment modulus)。當一種型別s的對齊模數與另一種型別t的對齊模數的比值是大於1的整數,我們就稱型別s的對齊要求比t強(嚴格),而稱t比s弱(寬鬆)。這種強制的要求一來簡化了處理器與記憶體之間傳輸系統的設計,二來可以提公升讀取資料的速度。比如這麼一種處理器,它每次讀寫記憶體的時候都從某個8倍數的位址開始,一次讀出或寫入8個位元組的資料,假如軟體能保證double型別的資料都從8倍數字址開始,那麼讀或寫乙個double型別資料就只需要一次記憶體操作。否則,我們就可能需要兩次記憶體操作才能完成這個動作,因為資料或許恰好橫跨在兩個符合對齊要求的8位元組記憶體塊上。某些處理器在資料不滿足對齊要求的情況下可能會出錯,但是intel的ia32架構的處理器則不管資料是否對齊都能正確工作。不過intel奉勸大家,如果想提公升效能,那麼所有的程式資料都應該盡可能地對齊。

ansi c標準中並沒有規定,相鄰宣告的變數在記憶體中一定要相鄰。為了程式的高效性,記憶體對齊問題由編譯器自行靈活處理,這樣導致相鄰的變數之間可能會有一些填充位元組。對於基本資料型別(int char),他們占用的記憶體空間在乙個確定硬體系統下有個確定的值,所以,接下來我們只是考慮結構體成員記憶體分配情況。

(0被認為是任何數的整數倍) 

自然對界(natural alignment)即預設對齊方式,是指按結構體的成員中size 最大的成員對齊。注:這裡的最大指整形資料,實型,結構體成員不在此例。

struct t ;

win32平台下的微軟c編譯器(cl.exe for 80×86)的對齊策略:

1) 結構體變數的首位址能夠被其最寬基本型別成員的大小所整除;

備註:編譯器在給結構體開闢空間時,首先找到結構體中最寬的基本資料型別,然後尋找記憶體位址能被該基本資料型別所整除的位置,作為結構體的首位址。將這個最寬的基本資料型別的大小作為上面介紹的對齊模數。

2) 結構體每個成員相對於結構體首位址的偏移量(offset)都是成員大小的整數倍,如有需要編譯器會在成員之間加上填充位元組(internal adding);

備註:為結構體的乙個成員開闢空間之前,編譯器首先檢查預開闢空間的首位址相對於結構體首位址的偏移是否是本成員的整數倍,若是,則存放本成員,反之,則在本成員和上乙個成員之間填充一定的位元組,以達到整數倍的要求,也就是將預開闢空間的首位址後移幾個位元組。

3) 結構體的總大小為結構體最寬基本型別成員大小的整數倍,如有需要,編譯器會在最末乙個成員之後加上填充位元組(trailing padding)。

備註:結構體總大小是包括填充位元組,最後乙個成員滿足上面兩條以外,還必須滿足第三條,否則就必須在最後填充幾個位元組以達到本條要求。

根據以上準則,在windows下,使用vc編譯器,sizeof(t)的大小為8個位元組。

而在gnu gcc編譯器中,遵循的準則有些區別,對齊模數不是像上面所述的那樣,根據最寬的基本資料型別來定。在gcc中,對齊模數的準則是:對齊模數最大只能是4,也就是說,即使結構體中有double型別,對齊模數還是4,所以對齊模數只能是1,2,4。而且在上述的三條中,第2條裡,offset必須是成員大小的整數倍,如果這個成員大小小於等於4則按照上述準則進行,但是如果大於4了,則結構體每個成員相對於結構體首位址的偏移量(offset)只能按照是4的整數倍來進行判斷是否新增填充。最後的大小來按照4來判斷。

看如下例子:struct t ;

那麼在gcc下,sizeof(t)應該等於12個位元組。

如果結構體中含有位域(bit-field),那麼vc中準則又要有所更改:

1) 如果相鄰位域字段的型別相同,且其位寬之和小於型別的sizeof大小,則後面的字段將緊鄰前乙個字段儲存,直到不能容納為止;

2) 如果相鄰位域字段的型別相同,但其位寬之和大於型別的sizeof大小,則後面的字段將從新的儲存單元開始,其偏移量為其型別大小的整數倍;

3) 如果相鄰的位域字段的型別不同,則各編譯器的具體實現有差異,vc6採取不壓縮方式(不同位域字段存放在不同的位域型別位元組中),dev-c++和gcc都採取壓縮方式;

備註:當兩欄位型別不一樣的時候,對於不壓縮方式,例如:struct n ;

依然要滿足不含位域結構體內存對齊準則第2條,i成員相對於結構體首位址的偏移應該是4的整數倍,所以c成員後要填充3個位元組,然後再開闢4個位元組的空間作為int型,其中4位用來存放i,所以上面結構體在vc中所佔空間為8個位元組;而對於採用壓縮方式的編譯器來說,遵循不含位域結構體內存對齊準則第2條,不同的是,如果填充的3個位元組能容納後面成員的位,則壓縮到填充位元組中,不能容納,則要單獨開闢空間,所以上面結構體n在gcc或者dev-c++中所佔空間應該是4個位元組。

4) 如果位域字段之間穿插著非位域字段,則不進行壓縮;

備註:結構體typedef struct

n3;在gcc下佔據的空間為16位元組,在vc下佔據的空間應該是24個位元組。

ps:對齊模數的選擇只能是根據基本資料型別,所以對於結構體中巢狀結構體,只能考慮其拆分的基本資料型別。(而對於對齊準則中的第2條,確是要將整個結構體看成是乙個成員,成員大小按照該結構體根據對齊準則判斷所得的大小。--不解這句話?據程式結果來看,無論是成員對齊還是最後的總大小填充,都是以最嚴格基本型別來判斷的)類物件在記憶體中存放的方式和結構體類似,這裡就不再說明。需要指出的是,類物件的大小只是包括類中非靜態成員變數所佔的空間,如果有虛函式,那麼再另外增加乙個指標所佔的空間即可。

struct test ;

struct test2 ;

int main()

vc將輸出24,而gcc將輸出16。還有#pragma pack()的一點補充

自身對齊值:即資料型別的自身的對齊值。例如char型的資料,其自身對齊值為1位元組;short型的資料,其自身對齊值為2位元組;int,float,long型別,其自身對齊值為4位元組;double型別,其自身對齊值為4位元組;而struct和class型別的資料其自身對齊值為其成員變數中自身對齊值最大的那個值。

指定對齊值:#pragma pack (value)時指定的對齊值value

有效對齊值:上述兩個對齊值中最小的那個。

struct a ;

#pragma pack (2) /* 指定按2位元組對齊 */

struct b ;

#pragma pack () /* 恢復預設對齊 */#pragma pack(push)和#pragma pack(pop)的意義是顯然的。

#pragma pack(n)

至於編譯器的對齊選項,忽略不計。

為了防止不同編譯器對齊不一樣,建議在**裡面指定對齊引數 

可能重要的一點是關於緊縮結構的。緊縮結構的用途 其實最常用的結構對齊選項就是:預設對齊和緊縮。在兩個程式,或者兩個平台之間傳遞資料時,我們通常會將資料結構設定為緊縮的。這樣不僅可以減小通訊量,還可以避免對齊帶來的麻煩。假設甲乙雙方進行跨平台通訊,甲方使用了「/zp2」這麼奇怪的對齊選項,而乙方的編譯器不支援這種對齊方式,那麼乙方就可以理解什麼叫欲哭無淚了。 當我們需要乙個位元組乙個位元組訪問結構資料時,我們通常都會希望結構是緊縮的,這樣就不必考慮哪個位元組是填充位元組了。我們把資料儲存到非易失裝置時,通常也會採用緊縮結構,既減小儲存量,也方便其它程式讀出。

各編譯器都支援結構的緊縮,即連續排列結構的各成員變數,各成員變數之間沒有任何填充位元組。這時,結構的大小等於各成員變數大小的和。緊縮結構的變數可以放在1n邊界,即任意位址邊界。在gnu gcc:

typedef struct st2tag

__attribute__ ((packed)) st2;

在armcc:

typedef __packed struct st2tag

st2;

在vc:

#pragma pack(1)

typedef struct st2tag

st2;

#pragma pack()

針對不同的編譯器:

#ifdef __gnuc__

#define gnuc_packed    __attribute__ ((packed))

#else

#define gnuc_packed

#endif

#ifdef __arm

#define arm_packed    __packed

#else

#define arm_packed

#endif

#ifdef win32

#pragma pack(1)

#endif

typedef arm_packed struct st2tag

gnuc_packed st2;

#ifdef win32

#pragma pack()

#endif

最後記錄乙個小細節。gcc編譯器和vc編譯器都支援在緊縮結構中包含非緊縮結構,例如前面例子中的st2可以包含非緊縮的st1。但對於arm編譯器而言,緊縮結構包含的其它結構必須是緊縮的。如果緊縮的st2包含了非緊縮的st1,編譯時就會報錯。

c c 中的記憶體對齊

32位linux 下 class a char c1 sizeof a 1 而非 4,這點有點出乎意料!按照對齊要求,在32位環境中預設的對齊是按照4位元組來的,但是這裡似乎沒有表現出4位元組的對齊要求!class b這樣定義 class b char c1 short s1 這個時候sizeof ...

C C 中記憶體對齊問題

我們通過幾個例子來全面搞懂c c 中的記憶體對齊問題。來看看下面的結構體大小分別是多大?假設均在32位機器上 struct a 這個相信大家都知道,由於變數都是char型別,對齊值為1,所以結構體大小為3。struct b 對齊值為4,結構體大小為 4 4 8。第乙個4為int,第二個4裡面包含乙個...

C C 中避免系統的位元組對齊

在定義了乙個新的struct後。系統會按照一定的規則將新生命的型別變數進行位元組對齊,如下結構體 typedef struct testtest 該結構體型別可能會被對齊為12個位元組。那麼,在記憶體流和檔案流操作中可能會出現這樣的用法 fwrite strptr,1,sizeof test len...