nlp 形式語言與自動機 ch10 統計機器翻譯

2021-08-01 15:11:49 字數 744 閱讀 6087

1、基於規則的轉換翻譯方法:

對源語言和目標語言都進行適當描述、把翻譯機制與語法分開、用規則描述語法的實現思想。

2、翻譯過程分為三段:

1)對輸入文字進行分析,形成源語言抽象的內部表達;

2)將源語言內部表達轉換成抽象的目標語言內部表達;

3)根據目標語言內部表達生成目標語言文字。

3、優缺點:

優點:可以較好地保持原文結構,產生的譯文結構和源文結構關係密切,尤其對於語言現象已知或句法結構規範的源語言句子具有較強的處理能力和較好地翻譯效果。

缺點:分析規則由人工編寫,工作量大,規則的主觀性強,規則的一致性難以保障,不利於系統擴充,尤其對非規範的語言現象缺乏相應的處理能力。

4、基於中間語言的翻譯方法:

5、基於雜訊通道模型的統計機器翻譯方法:

乙個翻譯系統被看作是乙個雜訊通道,對於乙個觀察到的通道輸出字串(句子)s,尋找乙個最大可能的通道輸入句子t,即求解t使概率p(t|s)最大,根據貝葉斯公式:

6、對齊使統計翻譯中的重要概念。

7、對位模型:

nlp 形式語言與自動機 ch09 詞義消歧

1 詞義消歧方法分為 監督的和無監督的。2 有監督的語義消歧方法 基於互資訊的消歧方法 基本思路 對每個需要消歧的多義詞尋找乙個上下文特徵,這個特徵能夠可靠地指示該多義詞在特定上下文語境中使用的是哪種語義。3 有監督的語義消歧方法 基於貝葉斯分類器的消歧方法 基本思路 在雙語語料庫中多義詞的翻譯 語...

形式語言與自動機複習 4 7

1.dfa轉正則語言 1.直接轉 需要注意的是,我們經常會處理到一p s p的情況,讓我們分析一下這個本質是什麼 可以把p看作p t看作p 那麼實際上 p s p 只會變成 p t p p 而p s q並沒有受到 p s t的影響 這也就是為什麼不會這麼迴圈的原因 如下 q0 q2 q0只會影響作用...

形式語言與自動機理論總結

一 圖形總結。重點 喬姆斯基體系 四大文法之間的關係 二 文字詳解。1,集合關係 並 交 補 差 笛卡爾積 冪積 二元關係 1 笛卡爾積 axb,即都分別對應的乘積。例1 1,a b 則 axb 2 冪積 2 a,即所有的子集。例1 2,a 則2 a 3 二元關係 任意的r a b,r 是a到b 的...