初學混淆矩陣

2021-09-23 01:53:24 字數 725 閱讀 6396

在中,混淆矩陣(confusion matrix)是視覺化工具,一般也叫做匹配矩陣。

混淆矩陣的每一列代表了**類別,每一行代表了資料的真實歸屬類別,每一列的總數表示**為該類別的資料的數目(即通過演算法被分為該類的數目),每一行的資料總數表示該類別的資料例項的數目

如下表,第一行第一列中的43表示有43個實際歸屬第一類的例項被**為第一類,第一行第二列中的5表示有5個實際歸屬第二類的例項被**為第一類。同理,第二行第一列的2表示有2個實際歸屬為第二類的例項被錯誤**為第一類。

如有150個樣本資料,這些資料分成3類,每類50個。分類結束後得到的混淆矩陣為:

類1類2

類3類1

類2類3

每一行之和為50,表示50個樣本,

第一行說明類1的50個樣本有43個分類正確,5個錯分為類2,2個錯分為類3。

源自:(1)通過網路資源查詢,基本論述是:

對於多分類問題,把每個類別單獨視為」正「,把其它剩餘的類別都視為」負「,按照二分類情況時的求解方法,求出此時的精確率與召回率,然後再取平均即可。

所主要檢視的資源:

(2)根據混淆矩陣,計算精確率與召回率的示例**:

(3)關於精確率、召回率和f值概念的介紹:

(4)利用fit_generator來獲得混淆矩陣:

示例2:

fit_generator的用法:

(5)利用python繪製混淆矩陣圖:

(6)混淆矩陣、auc和roc

混淆矩陣(confusion matrix)

乙個完美的分類模型是,將實際上是good的例項 成good,將bad的例項 稱bad。對於實際應用中的分類模型,可能 錯誤例項型別,因此我們需要知道到底 對了多少例項,錯了多少例項。混淆矩陣就是將這些資訊放在乙個表中,便於直觀的觀測和分析。在分類問題中,的情形存在如下四種 1.good good t...

混淆矩陣 Confusion Matrix

混淆矩陣是除了roc曲線和auc之外的另乙個判斷分類好壞程度的方法。以下有幾個概念需要先說明 tp true positive 真實為0,也為0 fn false negative 真實為0,為1 fp false positive 真實為1,為0 tn true negative 真實為1,也為1...

混淆矩陣 confusion matrix

我們以乙個二分類問題舉例說明 x x1,x2 x100 y 真實 1,0,0,0,1,1,1 假設60個1,40個0 y 0,1,0,1 70個1,30個0 假設我們 中的70個正例中只有50個是真正例 即 的真結果和實際情況一樣 假正例 70 50 20 故名思意,即 的正例和實際情況不一樣 查準...