資料探勘中的ROC曲線

2021-06-19 01:01:34 字數 713 閱讀 3732

基本術語

1、真正率(tpr, true positive rate),即命中率

tpr = tp / p = tp / (tp+fn)

2、假真正率(fpr, false positive rate),即錯誤命中率、假警報

fpr = fp / n = fp / (fp + tn)

3、準確度(acc, accuracy)

acc = (tp + tn) / (p + n)

roc空間

roc空間將偽陽性率(fpr)定義為 x 軸,真陽性率(tpr)定義為 y 軸。也即是乙個(0,0)到(1,1)的二維座標空間。

例如:乙個二元分類器,對於乙個樣本數為n的樣本空間,每個樣本x被**為真(1)的概率為p(x)。即選擇乙個閾值p(0),

使得p(x)>p(0)的樣本被**為真(1),且樣本數為m。而實際該樣本空間中,表現為真(1)的個數為n。這樣就得到,

tpr = m/n,fpr = (n-m)/(n-n),即在roc空間中,該點表示為(m/n,(n-m)/(n-n))。

roc曲線

根據上述描述關於roc空間的原理,通過改變不同的閾值p(k),k=0,1,2···k。根據

p(x)>p(k)得到m(k),即可得到點(m(k)/n,(n-m(k))/(n-n)),從而在roc空間裡繪出roc曲線。

MATLAB中繪製ROC曲線

我們通常使用roc曲線來評價分類結果的好壞,在matlab中繪製該曲線其實也十分容易。我們讓label 表示真實的類別,output 表示 的類別,那麼呼叫 xrf,yrf,trf,aucrf perfcurve label,output,1 之後執行 plot xrf,yrf 即可得到roc曲線,...

ROC曲線的意義

roc曲線的意義 roc曲線指受試者工作特徵曲線 receiver operating characteristic curve 是反映敏感性和特異性連續變數的綜合指標,是用構圖法揭示敏感性和特異性的相互關係,它通過將連續變數設定出多個不同的臨界值,從而計算出一系列敏感性和特異性,再以敏感性為縱座標...

ROC曲線的理解

1 roc曲線的概念 受試者工作特徵曲線 receiver operating characteristic curve,簡稱roc曲線 又稱為 感受性曲線 sensitivity curve 得此名的原因在於曲線上各點反映著相同的感受性,它們都是對同一 訊號刺激的反應,只不過是在幾種不同的判定標準...