精確率 召回率 F1(詳細)

2021-07-26 14:17:51 字數 2018 閱讀 8904

精確率召回率等相關知識點經常出現在筆試題中,如果僅考查精確率召回率並不難理解記憶。但是有時結合roc等知識點時,tp,np,tn,fn,4個不易區分的符號及各種比率會對初學者的理解產生干擾,本文將幾個知識點結合起來舉例解釋,希望能方便大家理解記憶。

當我們那乙個已知結果的資料對演算法進行測試時,不難發現演算法對資料判斷出現的錯誤。

當待處理資料簡單分為正負兩類時,顯然

對於原資料來說,只有正負兩種可能。對於判斷結果來說,也是正負兩種可能。

但是當我們站在」上帝」的角度上來看,原資料的正負,和判斷結果的正負會把整個資料分成4份。

tp : true positive (真正, tp)被模型**為正的正樣本;可以稱作判斷為真的正確率

tn : true negative(真負 , tn)被模型**為負的負樣本 ;可以稱作判斷為假的正確率

fp : false positive (假正, fp)被模型**為正的負樣本;可以稱作誤報率

fn : false negative(假負 , fn)被模型**為負的正樣本;可以稱作漏報率

總結:兩個詞中,第二個詞是**結果(演算法判斷的)。2個詞合在一起的是原資料事實

例如:10個樣本裡,有6個正,4個負。(事實

經過乙個機器學習演算法判斷後,認為有7個正,3個負。(判斷的

假設:

tp:被**為正的7名樣本裡,本來就是正,又被**為正的有5人。

tn:被**為負的3名樣本裡,本來就是負,又被**為負的有2人。

fp:被**為正的7名樣本裡,本來就是負,又被**為正的有2人。

fn:被**為負的3名樣本裡,本來就是正,又被**為負的有1人。

精確率precision rate:p=

tp/(

tp+f

p)

召回率recall rate:r=

tp/(

tp+f

n)

精確率體現的是演算法查詢的正確率,在被判斷為正的所有樣本中,判斷正確(事實)的比率。r=5/(5+2),是結合了事實與判斷的量。

召回率體現的是演算法的「清剿」能力。分母中的tp和fn都是事實上為正的樣本,而分子與精確率相同為tp。含義是在一群樣本中,把所有該找出來的量悉數找到的能力。是只有事實的量。

舉個直觀的例子,當查到1000個地區可能有**災害,此時**要重視精確率,還是召回率?這種情況是寧可多準備,也不能不準備等**來了無所適從。也就是說,要把樣本中所有的「階級敵人」全部查出來,肯定是要保證召回率。

那麼什麼時候召回率最高(為1),就是把1000個地區全**為**,反正1000個樣本裡肯定把**的地方包括全了。此時精確率的作用就看出來了。**數為1000,其中tp為10,1%的精確率,也就是說沒什麼可參考性。

有些同學就問了,那我怎麼衡量精確率和召回率相互之間的重要性呢?下面引入f1-score。* 2

∗p∗r

/(p+

r)=2

/(1/

p+1/r)*

f1-score是p和r的調和平均數,那麼也就容易理解,f1-score就是乙個認為精確率和召回率同樣重要的量。

那麼,如果我要把召回率的重要性提高為原來的一倍該如何處理呢?此時引入

fβ-score:(1

+β2)

∗(p∗

r)/(

β2∗p

+r)=

(1+β

2)/(

β2/r

+1/p

)

形式上看是一種加權的調和平均。因此,

當β等於2時,r的重要性比p大一倍。

當β等於0.5時,p的重要性比r大一倍。

如果只有這麼幾個公式記憶起來自然不難,可惜,接下來的roc,prc,auc。又會引入一些其他的統計量。見下文。

準確率 精確率 召回率 F1值

1.tp tn fp fn 圓的部分認定為檢測後是陽性的,其餘部分為檢測為陰性的 但是現在的情況是檢測並不完全準確,有可能檢測時陰性,但實際上已經有新冠,只是無症狀 現在只看園內,園的左半綠色部分意思是 實際上這個人是新冠患者 右辦粉色部分則為實際並不是新冠患者 那麼圓內綠色部分則為 真陽 對應 正...

模型評價指標 精確率,準確率,召回率,F1值

自然語言處理 nlp 機器學習 ml 資訊檢索 ir 等領域,評估 evaluation 是乙個必要的工作,而其評價指標往往有如下幾點 準確率 accuracy 精確率 precision 召回率 recall 和f1 measure。現在我先假定乙個具體場景作為例子。假如某個班級有男生80人,女生...

評估分類模型的指標 召回率 精確率 F1值

評估分類模型效能的方法是 混淆矩陣,其總體思路是統計a類別例項被 分類 為b類別的次數。召回率 recall 和精度 precise 是廣泛用於統計學分類領域的兩個度量值,用來評估分類結果的質量。召回率 recall rate,也叫查全率 是檢索出的相關文件數和文件庫中所有的相關文件數的比率,衡量的...