為何C語言(的函式呼叫)需要堆疊

2021-06-19 19:30:05 字數 4909 閱讀 8307

為何c語言(的函式呼叫)需要堆疊,而組合語言卻不需要堆疊

之前看了很多關於

uboot的分析,其中就有說要為

c語言的執行,準備好堆疊。

而自己在

uboot的

start.s彙編**中,關於系統初始化,也看到有堆疊指標初始化這個動作。但是,從來只是看到有人說系統初始化要初始化堆疊,即正確給堆疊指標

sp賦值,但是卻從來沒有看到有人解釋,為何要初始化堆疊。所以,接下來的內容,就是經過一定的**,試圖來解釋一下,為何要初始化堆疊,即:

為何

c語言的函式呼叫要用到堆疊,而彙編卻不需要初始化堆疊

要明白這個問題,首先要了解堆疊的作用。

關於堆疊的作用,要詳細講解的話,要很長的篇幅,所以此處只是做簡略介紹。

總的來說,堆疊的作用就是:儲存現場

/上下文,傳遞引數。

1.儲存現場/上下文

現場,意思就相當於案發現場,總有一些現場的情況,要記錄下來的,否則被別人破壞掉之後,你就無法恢復現場了。而此處說的現場,就是指

cpu執行的時候,用到了一些暫存器,比如

r0,r1等等,對於這些暫存器的值,如果你不儲存而直接跳轉到子函式中去執行,那麼很可能就被其破壞了,因為其函式執行也要用到這些暫存器。

因此,在函式呼叫之前,應該將這些暫存器等現場,暫時保持起來,等呼叫函式執行完畢返回後,再恢復現場。這樣

cpu就可以正確的繼續執行了。

在計算機中,你常可以看到上下文這個詞,對應的英文是

context。那麼:

1.1.

什麼叫做上下文context儲存現場,也叫儲存上下文。

上下文,英文叫做

context,就是上面的文章,和下面的文章,即與你此刻,當前

cpu執行有關係的內容,即那些你用到暫存器。所以,和上面的現場,是乙個意思。

儲存暫存器的值,一般用的是

push指令,將對應的某些暫存器的值,乙個個放到堆疊中,把對應的值壓入到堆疊裡面,即所謂的壓棧

然後待被呼叫的子函式執行完畢的時候,再呼叫

pop,把堆疊中的乙個個的值,賦值給對應的那些你剛開始壓棧時用到的暫存器,把對應的值從堆疊中彈出去,即所謂的出棧

其中儲存的暫存器中,也包括

lr的值(因為用

bl指令進行跳轉的話,那麼之前的

pc的值是存在

lr中的),然後在子程式執行完畢的時候,再把堆疊中的

lr的值

pop出來,賦值給

pc,這樣就實現了子函式的正確的返回。

2.傳遞引數

c語言進行函式呼叫的時候,常常會傳遞給被呼叫的函式一些引數,對於這些

c語言級別的引數,被編譯器翻譯成組合語言的時候,就要找個地方存放一下,並且讓被呼叫的函式能夠訪問,否則就沒發實現傳遞引數了。對於找個地方放一下,分兩種情況。

一種情況是,本身傳遞的引數就很少,就可以通過暫存器傳送引數。

因為在前面的儲存現場的動作中,已經儲存好了對應的暫存器的值,那麼此時,這些暫存器就是空閒的,可以供我們使用的了,那就可以放引數,而引數少的情況下,就足夠存放引數了,比如引數有

2個,那麼就用

r0和r1存放即可。(關於引數

1和引數

2,具體哪個放在

r0,哪個放在

r1,就是和

apcs中的「在函式呼叫之間傳遞

/返回引數」相關了,

apcs中會有詳細的約定。感興趣的自己去研究。)

但是如果引數太多,暫存器不夠用,那麼就得把多餘的引數堆疊中了。

即,可以用堆疊來傳遞所有的或暫存器放不下的那些多餘的引數。

3.舉例分析c語言函式呼叫是如何使用堆疊的

對於上面的解釋的堆疊的作用顯得有些抽象,此處再用例子來簡單說明一下,就容易明白了:用:

arm-inux-objdump –d u-boot > dump_u-boot.txt

複製**

可以得到

dump_u-boot.txt檔案。該檔案就是中,包含了

u-boot中的程式的可執行的彙編**,

其中我們可以看到

c語言的函式的源**,到底對應著那些彙編**。

下面貼出

兩個函式的彙編**,

乙個是clock_init,

另乙個是與

clock_init在同一

c原始檔中的,另外乙個函式

copycode2ram:

33d0091c :

33d0091c: 

e92d4070 

push 

33d00920: 

e1a06000 

mov r6, r0

33d00924: 

e1a05001 

mov r5, r1

33d00928: 

e1a04002 

mov r4, r2

33d0092c: 

ebffffef 

bl 33d008f0

... ...

33d00984: 

ebffff14 

bl 33d005dc

... ...

33d009a8: 

e3a00000 

mov r0, #0 ; 0x0

33d009ac: 

e8bd8070 

pop

33d009b0 :

33d009b0: 

e3a02313 

mov r2, #1275068416 

; 0x4c000000

33d009b4: 

e3a03005 

mov r3, #5 ; 0x5

33d009b8: 

e5823014 

str r3, [r2, #20]

... ...

33d009f8: 

e1a0f00e 

mov pc, lr

複製**

(1)clock_init部分的**

可以看到該函式第一行:

33d009b0: 

e3a02313 

mov r2, #1275068416 

; 0x4c000000

複製**

就沒有我們所期望的

push指令,沒有去將一些暫存器的值放到堆疊中。這是因為,我們

clock_init這部分的內容,所用到的

r2,r3等等暫存器,和前面呼叫

clock_init之前所用到的暫存器

r0,沒有衝突,所以此處可以不用

push去儲存這類暫存器的值,不過有個暫存器要注意,那就是

r14,即

lr,其是在前面呼叫

clock_init的時候,用的是

bl指令,所以會自動把跳轉時候的

pc的值賦值給

lr,所以也不需要

push指令去將

pc的值儲存到堆疊中。

而clock_init的**的最後一行:

33d009f8: e1a0f00e mov pc, lr

複製**

就是我們常見的

mov pc, lr,把

lr的值,即之前儲存的函式呼叫時候的

pc值,賦值給現在的

pc,這樣就實現了函式的正確的返回,即返回到了函式呼叫時候下乙個指令的位置。

這樣cpu就可以繼續執行原先函式內剩下那部分的**了。

(2)copycode2ram部分的**

其第一行:

33d0091c: e92d4070 push

複製**

就是我們所期望的,用

push指令,儲存了

r4,r5,r以及

lr。用

push去儲存

r4,r5,r6,那是因為所謂的儲存現場,以後後續函式返回時候再恢復現場,

而用push去儲存

lr,那是因為此函式裡面,還有其他函式呼叫:

33d0092c: 

ebffffef 

bl 33d008f0

... ...

33d00984: 

ebffff14 

bl 33d005dc

... ...

複製**

也用到了

bl指令,會改變我們最開始進入

clock_init時候的

lr的值,所以我們要用

push也暫時儲存起來。

而對應地,

copycode2ram的最後一行:

33d009ac: e8bd8070 pop

複製**

就是把之前

push的值,給

pop出來,還給對應的暫存器,其中最後乙個是將開始

push的

lr的值,

pop出來給賦給

pc,因為實現了函式的返回。

另外,我們注意到,在

copycode2ram的倒數第二行是:

33d009a8: e3a00000 mov r0, #0 ; 0x0

複製**

是把0賦值給

r0暫存器,這個就是我們所謂返回值的傳遞,是通過

r0暫存器的。

此處的返回值是

0,也對應著

c語言的原始碼中的「

return 0」

. 對於使用哪個暫存器來傳遞返回值:

當然你也可以用其他暫時空閒沒有用到的暫存器來傳遞返回值,但是這些處理方式,本身是根據

arm的

apcs的暫存器的使用的約定而設計的,你最好不要隨便改變使用方式,最好還是按照其約定的來處理,這樣程式更加符合規範。

為何C語言(的函式呼叫)需要堆疊,而組合語言不需要

uboot中start.s原始碼中指令級的詳盡解析 green waste 為何 c 語言 的函式呼叫 需要堆疊,而組合語言卻需要堆疊 之前看了很多關亍uboot的分析,其中就有說要為c語言的執行,準備好堆疊。而自己在uboot的start.s彙編 中,關於系統初始化,也看到有堆疊指標初始化這個動作...

c 函式堆疊呼叫

由乙個.cpp c檔案到達乙個可執行檔案分為以下幾部分 預編譯階段 進行巨集替換,刪除注釋,展開標頭檔案,新增行號等 編譯階段 進行詞法,語法,語義分析,和 優化,生成彙編指令 彙編 翻譯指令 連線階段 合併段和符號表,符號解析 執行階段 建立虛擬位址和物理對映,載入指令和資料,程式入口位址寫入暫存...

C語言函式呼叫中堆疊知識

c語言的程式執行可以說就是不斷的呼叫函式,從主入口的main函式到各種各樣的庫函式,再到使用者自定義的完成特定功能的函式。程式中關於乙個函式的操作主要包括三個方面。函式宣告,函式定義,函式呼叫。簡而言之,函式宣告顧名思義就是告訴編譯器有乙個這樣的函式,同時告訴編譯器它的返回值型別和引數型別 引數預設...