編譯器的編譯模板過程

2021-06-19 12:58:58 字數 3392 閱讀 8140

分類: c++ 模板類

2008-11-05 17:40

4622人閱讀收藏 

舉報編譯器

c++iostream

instantiation

linker程式設計

如何組織編寫模板程式 

前言常遇到詢問使用模板到底是否容易的問題,我的回答是:「模板的使用是容易的,但組織編寫卻不容易」。看看我們幾乎每天都能遇到的模板類吧,如stl, atl, wtl, 以及boost的模板類,都能體會到這樣的滋味:介面簡單,操作複雜。

我在5年前開始使用模板,那時我看到了mfc的容器類。直到去年我還沒有必要自己編寫模板類。可是在我需要自己編寫模板類時,我首先遇到的事實卻是「傳統」程式設計方法(在*.h檔案宣告,在*.cpp檔案中定義)不能用於模板。於是我花費一些時間來了解問題所在及其解決方法。

本文物件是那些熟悉模板但還沒有很多編寫模板經驗的程式設計師。本文只涉及模板類,未涉及模板函式。但論述的原則對於二者是一樣的。

問題的產生

通過下例來說明問題。例如在array.h檔案中有模板類array:

// array.h

template

class array

;t& operator(int i)

const t& get_elem (int i) const

void set_elem(int i, const t& value)

operator t*()       

};            

然後在main.cpp檔案中的主函式中使用上述模板:

// main.cpp

#include "array.h"

int main(void)

這時編譯和執行都是正常的。程式先建立乙個含有50個整數的陣列,然後設定陣列的第乙個元素值為2,再讀取第乙個元素值,最後將指標指向陣列起點。

但如果用傳統程式設計方式來編寫會發生什麼事呢?我們來看看:

將array.h檔案**成為array.h和array.cpp二個檔案(main.cpp保持不變)

// array.h        

template

class array

;t& operator(int i);

const t& get_elem (int i) const;

void set_elem(int i, const t& value);

operator t*();      

};        

// array.cpp

#include "array.h"

templatet& array::operator (int i)

templateconst t& array::get_elem(int i) const

templatevoid array::set_elem(int i, const t& value)

templatearray::operator t*()

編譯時會出現3個錯誤。問題出來了:

為什麼錯誤都出現在第乙個地方?

為什麼只有3個鏈結出錯?array.cpp中有4個成員函式。

要回答上面的問題,就要深入了解模板的例項化過程。

模板例項化

程式設計師在使用模板類時最常犯的錯誤是將模板類視為某種資料型別。所謂型別參量化(parameterized types)這樣的術語導致了這種誤解。模板當然不是資料型別,模板就是模板,恰如其名:

編譯器使用模板,通過更換模板引數來建立資料型別。這個過程就是模板例項化(instantiation)。

從模板類建立得到的型別稱之為特例(specialization)。 

模板例項化取決於編譯器能夠找到可用**來建立特例(稱之為例項化要素,

point of instantiation)。

要建立特例,編譯器不但要看到模板的宣告,還要看到模板的定義。

模板例項化過程是遲鈍的,即只能用函式的定義來實現例項化。

再回頭看上面的例子,可以知道array是乙個模板,array是乙個模板例項 - 乙個型別。從array建立array的過程就是例項化過程。例項化要素體現在main.cpp檔案中。如果按照傳統方式,編譯器在array.h檔案中看到了模板的宣告,但沒有模板的定義,這樣編譯器就不能建立型別array。但這時並不出錯,因為編譯器認為模板定義在其它檔案中,就把問題留給鏈結程式處理。

現在,編譯array.cpp時會發生什麼問題呢?編譯器可以解析模板定義並檢查語法,但不能生成成員函式的**。它無法生成**,因為要生成**,需要知道模板引數,即需要乙個型別,而不是模板本身。

這樣,鏈結程式在main.cpp 或 array.cpp中都找不到array的定義,於是報出無定義成員的錯誤。

至此,我們回答了第乙個問題。但還有第二個問題,在array.cpp中有4個成員函式,鏈結器為什麼只報了3個錯誤?回答是:例項化的惰性導致這種現象。在main.cpp中還沒有用上operator,編譯器還沒有例項化它的定義。

前二種方法通常稱為包含模式,第三種方法則稱為分離模式。

第一種方法意味著在使用模板的轉換檔案中不但要包含模板宣告檔案,還要包含模板定義檔案。在上例中,就是第乙個示例,在array.h中用行內函式定義了所有的成員函式。或者在main.cpp檔案中也包含進array.cpp檔案。這樣編譯器就能看到模板的宣告和定義,並由此生成array例項。這樣做的缺點是編譯檔案會變得很大,顯然要降低編譯和鏈結速度。

第二種方法,通過顯式的模板例項化得到型別。最好將所有的顯式例項化過程安放在另外的檔案中。在本例中,可以建立乙個新檔案templateinstantiations.cpp:

// templateinstantiations.cpp                

#include "array.cpp"

template class array ; // 顯式例項化

array型別不是在main.cpp中產生,而是在templateinstantiations.cpp中產生。這樣鏈結器就能夠找到它的定義。用這種方法,不會產生巨大的標頭檔案,加快編譯速度。而且標頭檔案本身也顯得更加「乾淨」和更具有可讀性。但這個方法不能得到惰性例項化的好處,即它將顯式地生成所有的成員函式。另外還要維護templateinstantiations.cpp檔案。

第三種方法是在模板定義中使用export關鍵字,剩下的事就讓編譯器去自行處理了。當我在

stroustrup的書中讀到export時,感到非常興奮。但很快就發現vc 6.0不支援它,後來又發現根本沒有編譯器能夠支援這個關鍵字(第乙個支援它的編譯器要在2023年底才問世)。自那以後,我閱讀了不少關於export的文章,了解到它幾乎不能解決用包含模式能夠解決的問題。欲知更多的export關鍵字,建議讀讀herb sutter撰寫的文章。

結論要開發模板庫,就要知道模板類不是所謂的"原始型別",要用其它的程式設計思路。本文目的不是要嚇唬那些想進行模板程式設計的程式設計師。恰恰相反,是要提醒他們避免犯下開始模板程式設計時都會出現的錯誤。

c 編譯器編譯過程

編譯過程 編譯過程分為四步 預處理 編譯 彙編 連線 1.預處理 預處理主要處理原始檔中的 include define 等預處理等命令 預處理主要完成的工作有 參考 程式設計師的自我修養 1 刪除 define,展開巨集 2 處理條件編譯指令。預處理程式先判斷條件,再根據條件修改源 3 刪除注釋 ...

方舟編譯器編譯過程

開發環境推薦ubuntu16.04 sudo apt get y install openjdk 8 jdk git core gnupg flex bison gperf build essential zip curl zlib1g dev libc6 dev i386 lib32ncurses...

編譯器的編譯基本過程

編譯器最基本的功能就是把高階語言 例如c fortran 編寫的 轉化為機器指令 就是01串 從這個角度來說它本質上是個轉換過程。經典的編譯過程主要包括 1 詞法分析 lexical analysis 語法分析的輸入是一連串的token 詞法分析的輸出 根據語言的語法規則不斷解析最後得到一棵抽象語法...