Facebook轉向神經網路機器翻譯(NMT)

2021-09-17 06:38:54 字數 1134 閱讀 9848

facebook近期宣布面向全球推出nmt(神經網路機器翻譯,neural machine translation)。從基於短語的翻譯模型轉向nmt,使得facebook可以支援超過兩千種的語言互譯,並達到了每天45億次的翻譯量。據facebook介紹,nmt使得blue分值增加了11%。bleu是一種廣為使用的翻譯評分機制。

\\ 撰寫該博文的工程師juan miguel pino、alexander sidorov和necip fazil ayan使用caffe2實現了2.5倍的效能提公升。caffe2是facebook於今年早期開源的乙個機器學習框架。

\\ nmt實現如此質量翻譯的關鍵,在於它使用的rnn(recurrent neural network)是一種具有注意機制(attention)的seq2seq(sequence-to-sequence) lstm(long short-term memory)。這樣的系統充分考慮到了原始語句的上下文以及該語句之前的全部內容,用於生成更為準確的翻譯內容。這使得在翻譯中可以使用長距離調序規則(long-distance reordering),解決了一些存在於英語-土耳其語和英語-希臘語等語言互譯中的問題。

\\ lstm的注意機制(attention)在處理翻譯中未知詞彙上非常有用,它將翻譯軟對齊到由訓練資料構建的雙語語料庫,並使用了削減詞彙量(vocabulary reduction)方法,在避免對翻譯質量產生顯著影響的情況下,有效地降低了計算時間。

\\ fb learner flow框架用於快速並準確地調優每一種語言互譯所使用的引數。3.7%的英語-西班牙語互譯bleu分值增加來自於該框架的貢獻。

\\ 作為專案的一部分,facebook將rnn貢獻到caffe2專案中,並作了開源。同時,facebook的fair(facebook』s artificial intelligence research)研究團隊已經公開發表了他們在機器翻譯中使用cnn(convolutional neural networks)的方法。

\\ google在2023年就發布了用於google翻譯的nmt,先於facebook此次發布達多個月。而在乙個月前,google宣布了multimodel神經網路模型這一突破性進展。

\\檢視英文原文:facebook transitioning to neural machine translation

Facebook轉向神經網路機器翻譯(NMT)

facebook近期宣布面向全球推出nmt 神經網路機器翻譯,neural machine translation 從基於短語的翻譯模型轉向nmt,使得facebook可以支援超過兩千種的語言互譯,並達到了每天45億次的翻譯量。據facebook介紹,nmt使得blue分值增加了11 bleu是一種...

神經網路 感知機

受生物學的啟發,人工神經網路是有一系列簡單的單元互相緊密聯絡構成的,每個單元有一定數量的實數輸入和唯一的實數輸出。神經網路的乙個重要的用途就是接受和處理感測器產生的複雜輸入並行進行自適應的學習。人工神經網路演算法模擬生物神經網路,是一種模式匹配演算法,通常用於解決分類和回歸問題。人工神經網路是機器學...

神經網路 一) 感知機

計算智慧型 是北航開的一門研究生課程,主要內容為神經網路的原理和應用。該課程從聖經網路的原理開始,以感知機 簡單神經網路為過渡,最後以深度學習結束。此博文為在學習該門課程的過程中,自己在完成課程作業的過程中的一些 和心得。作業一 感知機的基本原理與應用題目 設有兩個模式樣本集合 d1 d2 用感知機...