機器學習 效能度量指標之查準率和查全率

2021-08-27 21:14:04 字數 1101 閱讀 7570

在很多實際應用中,我們知道僅僅關心正確分類的結果是不夠的,並且,在資料偏斜比較嚴重的情況下,模型準確率可能具有相當程度的誤導性,我們也需要知道資料被錯誤分類的情況,以確認為此需要承擔的分類錯誤的代價。(false positive假陽性和false negative假陰性,這兩種情況)

查準率(precision精度):用於描述所有被正確分類的樣本中真陽性的比值。

查全率(recall召回率):真陽性樣本的數量與樣本集中所包含的全部陽性樣本的比值。

分類結果混淆矩陣

真實情況

**結果 正

反 正tp fn

反 fp

tn如上矩陣所示:

我們將演算法**的結果分為四種情況:

tp(true positive):真正例(正確肯定),**為真,實際為真

fn(false negative):假反例(錯誤否定),**為假,實際為真

fp(false positive):假正例(錯誤肯定),**為真,實際為假

tn(true negative):真反例(正確否定),**為假,實際為假

假設我們想要用機器學習演算法來**腫瘤是不是惡性的

其中,查準率的定義為:p=tp/(tp+fp)

它表示在所有我們**有惡性腫瘤的病人中,實際患有惡性腫瘤的病人百分比,比例越高,說明fp越小,查得越準。

召回率定義為:r=tp/tp+fn

它表示在所有實際是惡性的樣例中,**為惡性的比例。比例越高,說明fn越小,漏掉的惡性的樣例越少,查得越全。

降低閥值,提高recall

提高閥值,提高precision

在這塊我們可以看出,查準率和查全率直接是比較矛盾的,要想查準率高,那麼你就要將你最有把握認為是惡性的腫瘤選出來,但這樣就會漏掉一些被誤認為是良性,實際是惡性的腫瘤,使得查全率比較低;相反,要是想要查全率比較高,那麼就要在**的時候盡可能多的**一些腫瘤是惡性的,如果是這樣的話,那麼實際上是惡性的腫瘤確實被**出來了,查全率也確實高了,但相應,查準率也降低了。

那麼在這塊,我們引入f1度量,用它來平衡查準率與查全率

f1 = 2*p*r/(p+r) = 2pr/(樣例總數-tp-tn)

若對查準率/查全率有不同偏好:

機器學習效能度量

回歸評估指標 分類評估指標 聚類評估指標 參考常見的評估方法有 1.留出法 hold out 2.交叉驗證法 cross validation 3.自助法 bootstrap 將已有的資料集分為兩個互斥的部分 保證資料s與t的分布一致 測試集比例一般保持在1 3 1 5 將原始資料分成k組 一般是均...

周志華 機器學習 效能度量

2.5 效能度量 效能度量 performance measure 是衡量模型泛化能力的評價標準,在對比不同模型的能力時,使用不同的效能度量往往會導致不同的評判結果。本節除2.5.1外,其它主要介紹分類模型的效能度量。2.5.1 最常見的效能度量 在回歸任務中,即 連續值的問題,最常用的效能度量是 ...

機器學習常用效能度量指標

回歸任務最常用的指標是 均方誤差 mean squared error 給定樣例集d 其中yi是示例xi的真實標記。記f x 為 結果。均方誤差表示為 這兩個指標既適用於二分類任務,也適用於多分類任務。錯誤率是分類錯誤的樣本數佔樣本總數的比例,精度則是分類正確的樣本數佔樣本總數的比例。錯誤率定義為 ...