編譯器實現之旅第二章編譯器前端概觀

在這一章的旅程中，我們將要深入編譯器前端一**竟。看看編譯器前端到底由哪些元件組成，其分別又是在做什麼。

似乎比我們想象的要簡單，編譯器前端僅由兩個元件組成，詞法分析器與語法分析器。請看下圖：

+----------+             +-----------+
源** -> | 詞法分析器 | -> 記號流 -> | 語法分析器 | -> 抽象語法樹
+----------+ +-----------+

詞法分析器（lexer）是「前端中的前端」。作為整個編譯器的第乙個元件，詞法分析器負責閱讀並分割源**，將編譯器看來「鬍子連著辮子」的源**，分割為乙個個的記號（token）流，同時，詞法分析器還負責識別並歸類每乙個記號。當然了，一旦詞法分析器發現了乙個不應該出現的字元，其就會產生乙個錯誤資訊。詞法分析器的工作內容如下圖所示：

+----------+
源** -> | 詞法分析器 | -> (記號的類別, 記號字串), (記號的類別, 記號字串), ...
+----------+

我們將在詞法分析器的相關章節進一步講述詞法分析器的故事。

源**在經過詞法分析器無情的切割後，就到了語法分析器該上場的時候了。不難發現，詞法分析器所做的工作雖然很厲害，但其終究只是完成了類似於資料清洗的工作，輸出的只是線性的記號流，這就像一大段沒有章節，甚至沒有標點的文字，根本沒法閱讀。

語法分析器利用詞法分析器的工作成果，將線性的，扁平的記號流，根據語法規則重新組織為一棵立體的巨大的樹，這就是抽象語法樹（ast）。抽象語法樹在整個編譯器中起著舉足輕重的地位，其是整個編譯器後端都很喜歡，並需要不斷訪問的一種資料結構。語法分析器的工作內容如下圖所示：

+-----------+
(記號的類別, 記號字串), (記號的 類別, 記號字串), ... -> | 語法分析器 | -> 抽象語法樹
+-----------+

我們將在語法分析器的相關章節進一步講述語法分析器的故事。

編譯器實現之旅第二章編譯器前端概觀

編譯器實現之旅第一章編譯器概觀

gcc編譯器（二）

編譯器實現（六）

編譯器實現之旅 第二章 編譯器前端概觀

編譯器實現之旅 第一章 編譯器概觀

gcc編譯器（二）

編譯器實現（六）

相關推薦

編譯器實現之旅第二章編譯器前端概觀

編譯器實現之旅第一章編譯器概觀