簡要說明 機器翻譯演進過程

2021-09-23 18:21:29 字數 1093 閱讀 4403

rule-basedmachine translation,興起於上世紀70年代,基於語言學規則,讓當時運算緩慢的機器重複翻譯人員的工作方式。

變種:

**直接機器翻譯:**它會將文字分成詞,然後翻譯這些詞,再稍微校正一下形態,最後協調句法得到結果,消耗大量語言學家去為每個詞編寫複雜規則。

**基於遷移的機器翻譯:**操作句子結構,不是操作每個詞,這樣可以得到好些的詞序。詞結構的數量比單個的詞要多得多,這又會變得更加複雜。

**語際機器翻譯:**利用中間表徵(世界語言),做兩種語言間的過渡。英文翻譯成中間表徵,中間表徵翻譯成中文,從而將英文翻譯成中文。

example-basedmachine translation,2023年,長尾真(京都大學)提出了乙個思想:使用已有的短語而不是重複進行翻譯。

**變革意義在於:**以前是不斷向機器輸入規則,現在是向機器輸入翻譯結果,不必花費多年時間構建語言規則和例外。

statisticalmachine translation,1990 年初,ibm研究中心首次展示統計機器翻譯系統,它對語言學和規則一無所知的。從統計機器翻譯開始,不再向機器輸入大量規則,而是訓練機器去學習。

指導方針:統計結果和這樣的邏輯(如果人們這樣翻譯,我也這樣翻譯)。

分類:

**基於詞的 smt:**最早期的統計翻譯系統的工作方式是將句子分成詞。仍然無法處理格、性和同義詞。

**基於短語的 smt:**很長一段時間,大約2006到2023年這種翻譯方法是主流翻譯方法。通過統計、重新排序和詞法分析,機器能學習翻譯穩定的詞組合。

**基於句法的 smt:**機器學習與基於規則的方法融合,效果很差,沒有發展起來。

neural machine translation,近幾年提出來的翻譯技術,認為語言是特徵集,神經網路學習這些特徵,通過另乙個神經網路把它翻譯成另一種語言。

**與語際機器翻譯的區別:**神經網路翻譯是機器尋找語言特徵,而非人規定的規則。深度學習擁有搜尋這些特定特徵的能力。龐大的神經網路,可以尋找到語言中的各個特徵。

**特點:**統計機器翻譯使用英語為關鍵源,中文與德語翻譯時需要借助英文;神經網路翻譯不需要這樣做,中文與德文可以直接翻譯。

BCP簡要說明

bcp是sybase公司提供專門用於資料庫表一級資料備份的工具。一般存放在所安裝的ase或者open client 的bin目錄中。12版本以前的ase,bcp存放目錄為 sybase bin 12版本 含12版本 以後存放目錄為 sybase ocs 12 x bin 其中 sybase為syba...

initcall debug簡要說明

linux version 3.10.40 1.使用說明 documentation kernel parameters.txt中的說明如下 initcall debug knl trace initcalls as they are executed.useful for working out ...

ramoops pstore簡要說明

1.pstore pstore是persistent storage的縮寫。核心發生異常時如果能將日誌等資訊儲存下來不丟失,那麼就可以通過這些資訊來定位問題。不同的平台可以提供的儲存位置不同,例如有些平台支援硬碟,有些不支援。除了平台差異,異常型別也決定了在發生異常時該儲存位置是否還可用。pstor...