Unix環境高階程式設計學習筆記之程序環境(1)

2021-07-06 07:55:11 字數 4018 閱讀 7058

學完uml後開始繼續學習linux環境下的程式設計,apue很厚,我直接挑我最感興趣的幾章開始學習,今天學習了程序環境有關的知識,遇到了很多以前從未想過的問題,在這做個筆記做個記錄。

程序環境主要要討論的問題就是當程式執行時,main函式是如何被呼叫的,命令列引數是如何傳遞給新程式的,典型的儲存空間布局是什麼樣式,如何分配另外的儲存空間,程序如何使用環境變數,程序的各種不同終止方式等等。

在unix系統中,linux 系統一共有 8 種程序終止方式。

其中 5 種為正常終止方式:

1)從 main() 函式返回;

2)呼叫 exit(3) 函式;

3)呼叫 _exit(2) 或 _exit(2) 函式;

4)最後乙個執行緒從其啟動例程返回;

5)從最後乙個執行緒呼叫 pthread_exit(3) 函式。

剩下的 3 種為異常終止方式:

6)呼叫 abort(3) 函式;

7)接收到乙個訊號;

8)最後乙個執行緒對取消請求作出響應。

本章要重點討論的是退出函式,對於退出函式來說,_exit和_exit都是立即進入核心態,而exit函式則要先執行一些清理操作,然後再返回核心。

以下為函式原型:

#include void exit(int status);

void _exit(int status);

#include void _exit(int status);

我們知道,核心啟動執行乙個c程式的時候,也就是呼叫我們的main函式之前,是首先呼叫乙個特殊的啟動例程的。可執行程式檔案將次啟動例程指定為程式的起始位址,啟動例程還會從核心中取得命令列引數和環境變數的值,然後為按上述方式呼叫的main函式做好安排。

所以對於上述的exit函式,其真實的呼叫應該是這樣的:

exit(main(argc,argv))

ps:上述的函式中使用不同的標頭檔案是因為exit和_exit是由iso c說明的,而_exit是由posix.1說明的。

其中三個函式都帶乙個整型引數是status,這個表示了終止狀態。如果說呼叫這些函式時不帶終止狀態,main執行了乙個無返回值的return語句,或者main沒有宣告返回型別為整型,則程序的終止狀態是未定義的。如果main函式的返回型別是整型,並且main執行到最後一句時返回(隱式返回),那麼程序的終止狀態是0。

現在對於exit函式,其可以在退出時做一系列清理現場的工作,那麼這個工作我們是否可以自定義呢?答案是肯定的。

unix系統提供了乙個函式叫做atexit,用他,乙個程序最多可以登記32個函式,這些函式在退出時候會由exit函式自動呼叫來輔助清理,這些函式我們稱之為終止處理程式。

從這張圖可以看到,退出方式有很多,在main函式呼叫使用者函式的時候可以直接進行退出,進入核心態,使用者函式main函式和啟動例程也都可以呼叫_exit或者_exit函式來直接進入核心態,exit函式則要進行一系列的終止處理。書上給出了乙個例項:

最後的執行結果是:

main is done

first exit handler

first exit handler

second exit handler

由此可見,對於atexit函式來說,終止處理程式的執行順序和它們登記的時候的順序正好相反。

每個程式都有一張環境表,環境表主要用來儲存系統中的一系列環境變數,環境表還有乙個環境指標指向他,如圖所示:

c程式一直由以下幾部分組成:

正文段。這是由cpu執行的機器指令部分。通常,正文段是可共享的,所以即使是頻繁的執行程式,在儲存器中也只有乙個副本,另外,正文段常常是制度的,以防止程式由於意外而修改其指令。

初始化資料段。通常將此稱為資料段,它包含了程式中需明確地賦初值的變數。例如,c程式中出現在任何函式之外的宣告:

int maxcount = 99;

非初始化資料段。通常將此段稱為bss段,這一名稱**於乙個早期的彙編運算子,意思是「block started by symbol"(由符號開始的塊),在程式開始執行之前,核心將此段中的資料初始化為0或空指標。出現在任何函式外的c宣告

long sum[1000];

棧。自動變數以及每次函式呼叫時所需儲存的資訊都存放在此段中。每次呼叫函式時,其返回位址以及呼叫者的環境變數(例如某些機器暫存器的值)都存放在棧中。然後,最近被呼叫的函式在棧上為其自動和臨時變數分配儲存空間。通過以這種方式使用棧,可以遞迴呼叫c函式。遞迴函式每次呼叫自身時,就使用乙個新的棧幀,因此乙個函式呼叫例項中的變數集不會影響另乙個函式呼叫例項中的變數。

堆。通常在堆中進行動態儲存分配。由於歷史上形成的慣例,堆位於非初始化資料段和棧之間。

特別要注意的是堆,堆是用於存放程序執行中被動態分配的記憶體段,它的大小並不固定,可動態擴張或縮減。當程序呼叫malloc等函式分配記憶體時,新分配的記憶體就被動態新增到堆上(堆被擴張);當利用free等函式釋放記憶體時,被釋放的記憶體從堆中被剔除(堆被縮減)。

下面來談動態分配,unix提供了3個用於儲存空間動態分配的函式:

(1) malloc   分配指定位元組數的儲存區。此儲存區中的初始值不確定

(2) calloc   為指定長度的物件,分配能容納其指定個數的儲存空間。該空間中的每一位(bit)都初始化為0

(3) realloc  更改以前分配區的長度(增加或減少)。當增加長度時,可能需將以前分配區的內容移到另乙個足夠大的區域,而新增區域內的初始值則不確定

在unix中程式也可以設定自己的環境變數,提供了三個函式:

int putenv(char *str);

int setenv(const char *name, const char *value, int rewrite);

int unsetenv(const char *name);

三個函式返回值:成功返回0,出錯返回非0

getenv()函式就是獲得某個環境變數的值;

putenv()取形式為name = value的,並將其放入環境表中。如果n

ame已經存在,則先刪除原來的定義

字串。setenv()將name設定為value。如果環境中name已經存在,則若rewrite非0,則首先刪除現有的定義;若rewrite為0,則不刪除現有定義(什麼都不幹)。

unsetenv()則刪除name的定義,即使不存在也不出錯。

現在,環境表和環境字串是存放在我們前面的儲存空間的頂部的,也就是棧的上面,如果我要刪除乙個環境變數,那麼很簡單,只要在環境表中找到該指標,然後將所有後續指標都向環境表首部順次移動乙個位置。如果我們要增加乙個字串或者修改呢?那就比較麻煩了。

環境表和環境字串通常佔有的是程序位址空間的頂部,所以不能向上擴充套件,不然就影響到別的程式了,同時下面就是棧,所以也不能向低位址進行擴充套件,那麼我們就需要呼叫malloc函式為新的表分配空間,這個空間是向堆去申請的,申請過後,把原來的表複製乙份到新的記憶體空間,然後把你新插入的環境變數插入到這個表的表尾,最後在後面再放入乙個空指標,再用環境指標指向這個表,就完成了整個過程。書上最後還說,此表中的大多數指標仍然指向棧頂上的各個name=value串,我的理解是,對於原來的環境變數,應該還是老位置,新的環境變數則插入到新申請的堆空間中。

UNIX環境高階程式設計學習筆記

include include include include int main int argc,char argv err sys can t open s argv 1 while dirp readdir dp null printf s n dirp d name closedir dp ...

UNIX環境高階程式設計學習筆記 程序

2.程序控制 在提出這個問題的時候,我想了一下,大概就是核心執行的乙個程式 錯誤回答 吧。但是這麼說,連我自己下次看都不明白在說什麼。於是我查了一下,它代表著cpu所能處理的單個任務,及執行例項。在面向程序設計的系統 如早期 unix,linux 2.4及更早版本中 程序是程式的基本執行實體 在面向...

Unix環境高階程式設計學習筆記 二

三種主要的標準 iso c ieee posix single unix specification xsi 一層一層遞增,ieee posix 是iso c的超集。xsi 是posix的超集。要想提高軟體的可移植性,就必須有限制 編譯時限制 因為某些限制是固定的,則可以在標頭檔案中定義。執行時限制...