效能度量之分辨

目錄效能度量

例項與總結

參考文獻

機器學習中，效能度量（performance measure）的方法繁多。本文借助混淆矩陣（confusion matrix）分析了若干度量的計算方法與物理含義，並以當前肺炎疫情為背景進行舉例，期望幫助讀者更好地分辨學習器的效能度量。

乙個常見的二分類問題的混淆矩陣如下：

實際陽性

實際陰性

檢測陽性

tp-ture positive

fp -false positive

檢測陰性

fn -false negative

tn -true negative

**中，縱向的資料表示真實值，而橫向資料表示**值。positive(p)和negative(n)只取決於**值，與真實值無關；**值與真實值相符被稱為true(t)，不相符則為false(f)。

為了進一步理解這四個概念，下面假設了一次普通流感（陰性）與新冠肺炎（陽性）的檢測結果：

肺炎患者（實際陽性，8）

流感患者（實際陰性,10）

檢測為肺炎（9）

tp = 7

fp = 2

檢測為非肺炎（9）

fn = 1

tn = 8

tp，實際為陽性，同時被檢測為陽性。tp=7，有7個感染了新冠病毒的患者被檢測了出來。

fp，實際為陰性，但被檢測為陽性。fp=2，有2個流感患者被誤認為是肺炎病人。

fn，實際為陽性，但被檢測為陰性。fn=1，有1個肺炎病人被漏檢，方法誤認為他（她）是流感患者。

tn，實際為陰性，同時也被檢測為陰性。tn=8，有8個實際為普通流感的患者被篩選了出來。

對於混淆矩陣，有以下幾點需要注意：

下面基於混淆矩陣介紹5種效能度量。它們分別描述了分類器在特定任務上的表現，而這些任務與實際應用是密不可分的。

\[accuracy = \frac

\]\[sensitivity = \frac

\]\[specificity = \frac

\]\[ppv = \frac

\]\[npv = \frac

\]這部分，針對假設的資料進行分類器效能計算，並進一步總結各個效能指標。

肺炎患者（實際陽性，8）

流感患者（實際陰性,10）

檢測為肺炎（9）

tp = 7

fp = 2

檢測為非肺炎（9）

fn = 1

tn = 8

效能度量

計算直觀描述

過分強調的後果

準確度\(\frac=83.3\%\)

廣而範的準確性度量

忽略了樣本總量間的比例關係，失去參考價值

敏感度\(\frac=87.5\%\)

對陽性樣品的敏感程度

分類器過於敏感（激進），增加實際為陰性的誤判率

特異度\(\frac=80.0\%\)

對陰性樣本的敏感程度

分類器過於保守，大量的陽性可能因此漏檢

精確度\(\frac=77.7\%\)

陽性標籤的置信度，與敏感度相對

分類器過於謹慎，陽性可能因此漏檢

負**性

\(\frac=88.9%\)

陰性標籤的置信度，與特異性相對

分類器過於謹慎，陰性可能因此漏檢

[1]

思維遊戲之分辨姐妹 1

思維遊戲 1 之分辨姐妹有姐妹二人,乙個胖乙個瘦，姐姐上午很老實,一到下午就說假話妹妹則相反,上午說假話,下午卻很老實。有一天,乙個人去看她倆，問哪位小姐是姐姐呢?胖小姐回答說我是。而瘦小姐回答說是我啊。再問一句現在幾點鐘了？胖小姐說快到中午了。而瘦小姐卻說中午已經過去了。請問，當...

分類效能度量

錯誤率是分類錯誤的樣本數佔總樣本數的比例精度是分類正確的樣本數佔總樣本數的比例查準率p 真正例為正的樣本數 tp tp fp 是指挑出來的東西裡，有多少是好的。查全率r 真正例實際為正的樣本數 tp tp fn 是指全部的好東西，挑出來了多大比例。p r圖查全率為橫軸，查準率為縱軸，包線在...

聚類效能度量

聚類的效能是很難度量，因為它是從資料中學習，並歸類。資料的特性的多方面的，那麼歸類的結果也會是多種。比如蘋果，可以從顏色紅綠也可以從形狀圓的橢圓的歸類，沒有一定的形式。但是我們還是試圖找到一些方法來評價聚類演算法的效能。主要分為外部指標和內部指標兩大類。外部指標是指，將結果與參考的模型...

效能度量之分辨

思維遊戲之分辨姐妹 1

分類效能度量

聚類 效能度量

相關推薦

聚類效能度量