喬姆斯基正規化

2022-03-06 12:32:24 字數 815 閱讀 6831

在電腦科學中,乙個形式文法是chomsky 正規化的,當且僅當所有產生規則都有如下形式:

a → bc 或

a → α 或

s → ε

這裡的 a, b 和 c 是非終結符,α 是終結符(表示常量值的符號),s 是開始符號,而 ε 是空串。還有,b 和 c 都不可以是開始符號。

所有的 chomsky 正規化的文法都是上下文無關,反過來,所有上下文無關文法都可以有效的變換成等價的 chomsky 正規化的文法。

除了(在文法可能生成空串的時候包括的)可選規則 s → ε 是例外,chomsky 正規化的文法的所有規則都是擴張的,就是說在字串的整個匯出過程中,每個終結符和非終結符的字串比起前面匯出的字串要麼同樣長度要麼多出乙個元素。長度 n 的字串的匯出總是精確的 2n-1 步長。

chomsky 正規化得名於諾姆·喬姆斯基,他是發明喬姆斯基層級的美國語言學家。

長度為n個字串需要n次a → α 的派生,因此需要n個語法變元;

n個變元需要n-1次a → bc 的派生(從s開始,每次派生增加1個變元,增加n-1次);

由1.、2.得知,長度為n且滿足喬姆斯基正規化語法的字串恰好需要2n-1次派生。

進一步的,因為匯出非終結符的所有規則都把乙個非終結符變換成兩個非終結符,基於 chomsky 正規化的文法上的乙個分析樹是二叉樹,而這個樹的高度被限制於最高為這個字串的長度。

由於這些性質,在語言和可計算性領域中很多證明採用了 chomsky 正規化。這些性質還產生了基於 chomsky 正規化的文法的各種有效演算法;例如,判定給定字串是否可以被使用 chomsky 正規化的給定文法生成的 cyk演算法。

喬姆斯基文法

根據對產生式施加的限制不同,喬姆斯基 chomsky 定義了四類文法和語言。0型文法 短語結構文法或無限制文法,可使用任何的語法描述形式 1型文法 也叫上下文有關文法,其描述能力相當於線性有界自動機,語法形式如下 xsy xay。也就是說,s推導出a是和上下文x,y相關的,即s只有在上下文x,y的環...

喬姆斯基的文法分類

終結符,通俗的說就是不能單獨出現在推導式左邊的符號,也就是說終結符不能再進行推導。不是終結符的都是非終結符。非終結符可理解為乙個可拆分元素,而終結符是不可拆分的最小元素。如 有 則 必然是個非終結符。一般書上把非終結符用大寫字母表示,而終結符用小寫字母表示。識別符號就是開始符。由文法產生語言句子的基...

喬姆斯基生成語法 喬姆斯基的轉換生成語法理論

無論是分析哲學還是歐洲大陸哲學,都重視研究語言,這是當代西方哲學的乙個重要特徵,語言不能脫離世界,語言只有表現世界才有它正真的存在。當代美國語言大師喬姆斯基首創了轉換生成語法理論,正是這種轉換生成語法在語言中挑起了一場革命。它標誌著西方語言學的研究,尤其是美國的語言學界研究進入了乙個嶄新的時代,即喬...