為何選用F1值(調和平均數)衡量P與R?

2021-09-12 03:08:12 字數 3046 閱讀 7708

已知混淆矩陣

prediction positive

prediction negative

actuality positive

true positive(tp)

false negative(fn)

actuality negative

false positive(fp)

true negative(tn)

其中:precise(精確率/查準率)= tpt

p+fp

\frac

tp+fpt

p​,表示所有**為positive的集合中實際為positive的頻率;

recall(召回率/查全率)= tpt

p+fn

\frac

tp+fnt

p​,表示所有實際為positive的集合中**為positive的頻率。

1、「p-r」曲線

對我們來說,p

pp 和 r

rr 都為1的模型是最完美的,但實際情況卻並不像我們想的那樣,通過「 p

pp-r

rr」曲線,對模型判斷

為了防止極端小的 p和r

p 和 r

p和r 值影響我們對模型的判斷,一般通過曲線下面積或 p=r

p=rp=

r 的平衡點作為判別標準。以平衡點判別被認為過於簡單。

2、f

1f_1

f1​值(p和r的調和平均數)

引如f

1f_1

f1​值作為二分類問題的模型效能度量標準

f 1=

2prp

+r

f_1=\frac

f1​=p+

r2pr

​這裡f

1f_1

f1​是基於 p

pp 和 r

rr 的調和平均數,即 f

1f_1

f1​ 的倒數為 p

pp 和 r

rr 的倒數之和的二分之一1f1

=(1p

+1r)

×1

2\frac=(\frac+\frac)\times\frac

f1​1​=

(p1​

+r1​

)×21

​在統計學中,調和平均數(f

ff)、幾何平均數(g

gg)、算數平均數(x

‾\overline x

x)它們之間的關係用公式表示為

f ≤g

≤x

‾f\le g\le \overline x

f≤g≤

x其中,f=2

aba+

bf=\frac

f=a+b2

ab​、g=a

bg=\sqrt

g=ab​、x‾=

a+b2

\overline x=\frac

x=2a+b

​,當且僅當 a=b

a=ba=

b 時上面等式成立

證明如下:

假設存在 a,b

>

0a,b\gt 0

a,b>0,則

( a+

b)2−

(2ab

)2

(a+b)^-(2\sqrt)^

(a+b)2

−(2a

b​)2

= a2

+b2+

2ab−

4a

b=a^+b^+2ab-4ab

=a2+b2

+2ab

−4ab

= a2

+b2−

2a

b=a^+b^-2ab

=a2+b2

−2ab

= (a

−b)2

≥0

=(a-b)^\ge 0

=(a−b)

2≥0,當且僅當 a=b

a=ba=

b 時等式成立

即 ( a+

b)2≥

(2ab

)2

(a+b)^\ge (2\sqrt)^

(a+b)2

≥(2a

b​)2

已知 a,b

>

0a,b\gt 0

a,b>

0,則a+b

≥2ab

a+b\ge2\sqrt

a+b≥2a

b​推出 2ab

a+b≤

abab

≤ab≤

a+b2

\frac\le\frac}\le\sqrt \le\frac

a+b2ab

​≤ab

​ab​

≤ab​

≤2a+

b​當且僅當 a=b

a=ba=

b 時等式成立

即證。這三種平均數各有利弊,但調和平均數受極端值影響較大,更適合評價不平衡資料的分類問題。

3、舉例

已知三種模型得到的 p

pp 和 r

rr 值如下,分別計算三種平均數

p ppr

rrx

‾\overline xxgg

gf1

f_1f1

​algorithm 1

0.50.4

0.45

0.45

0.44

algorithm 2

0.70.1

0.40.27

0.18

algorithm 3

0.02

1.00.51

0.14

0.04

可以看出演算法3的 p

pp 值非常小,我們認為此模型效果不好,但是利用算數平均數和幾何平均數來衡量並不能表現出來,只有 f

1f_1

f1​ 對極端值比較重視,能夠感受到這種變化。

參考[1]統計學

[2]機器學習基礎-模型效能度量

F1 專業術語

f1年度錦標o積分制 championship points f1的年度錦標分為兩種 車手錦標及車隊錦標。在很多f1專家的眼中,車隊錦標的價值大於車手錦標。計分方式是採用積分制,車手與車隊的積分都是相加累積的。f1賽事成績的評分是由國際汽聯 fia 依據每站賽程比賽的結果來評定積分的。每站f1比賽的...

F1賽車的起源

作為世界上三大體育運動之一,f1是一項高科技 高費用 高速度的運動。但首先是汽車運動。f1起源與車,其落腳點也必然是車。因為賽車是聯結整個f1產業鏈的紐帶。拿盛極一時法拉利車隊為例,如果離開了法拉利汽車公司,其結果就是失去競爭力,甚至退出f1舞台。同樣,由於福特的去意,美洲虎車隊已經瀕臨退出f1的邊...

準確率 精確率 召回率 F1值

1.tp tn fp fn 圓的部分認定為檢測後是陽性的,其餘部分為檢測為陰性的 但是現在的情況是檢測並不完全準確,有可能檢測時陰性,但實際上已經有新冠,只是無症狀 現在只看園內,園的左半綠色部分意思是 實際上這個人是新冠患者 右辦粉色部分則為實際並不是新冠患者 那麼圓內綠色部分則為 真陽 對應 正...