nlp BLEU ROUGE評價指標

2022-05-01 14:48:12 字數 396 閱讀 7840

bleu,rouge一般在翻譯裡用

bltk工具箱中就有bleu的評估指標實現

bleu通過比較**語句和參考語句裡的n-gram(從1-gram到4-gram)的重合程度。顯然,重合程度越高,譯文的質量就高。1-gram主要是用於比較單個單詞的準確率,而2~4-gram則用於衡量句子的流暢性。

這個評價指標,關心的是**語句的準確率,而沒有考慮到**語句的缺失率。

即計算的時候,用**語句的n-gram個數做分母

分子是相同gram的個數

rouge就只計算了**語句的召回率。

在實際的神經網路機器翻譯出的語句通常是比較流暢的,但有時會瞎翻譯,

即計算的時候,用參考譯文的n-gram個數做分母。

分子是相同gram的個數

參考:

評價系統 服務評價系統 客戶評價系統 首頁

汽車音響在國內尚屬於剛起步階段,很多人即便是一些從業者對此也並沒有特別明確的認識。其實,對於消費者而言,我們並不需要知道太深層次的知識,只需要知道一些基本的評價汽車音響好壞的方法。但對於從業者而言,對車載音響系統而言,如果不能夠作出準確的主觀評價將會直接影響最終產品的表現。總的來說,車載音響系統的主...

量化評價和質化評價舉例 量化評價和質性評價異同點

量化評價和質性評價在理論上有分歧,但它們不是兩種對立的方法,在課程評價中是非常必要和不可缺少的。它們的分歧能在課程評價實踐中統一起來,互相彌補各自的缺點。1.量化評價的特點 量化評價的優點是邏輯性強,標準化和精確化程度較高,能對課程現象的因果關係作出精確分析,結論也更為客觀和科學。然而,影響制約教育...

uniapp 評價應用 如何評價uni app?

先說好的方面 除去常規的一些增刪改查以及產品的業務以外,我們還整合了以下一些功能。5,直播 直播我們先後版本用了兩套方案。6,推送。7,語音播報。8,自動更新。9,地圖。我問過一些用其他技術棧的朋友,我就不點名用的什麼技術棧了,免得引戰,他們的產品裡面沒有整合我以上這些功能,更多就是一寫增刪改查的東...