多分類評估指標

多分類指標的情況

二分類和多分類其實沒有多少區別。用的公式仍然是y=wx + b。但有乙個非常大的區別是他們用的啟用函式是不同的。邏輯回歸用的是sigmoid，這個啟用函式的除了給函式增加非線性之外還會把最後的**值轉換成在【0,1】中的資料值。也就是**值是0

我們最後的一層中使用的啟用函式就是softmax。我們發現跟二分類在輸出層之後乙個單元不同的是，使用softmax的輸出層擁有多個單元，實際上我們有多少個分類就會有多少個單元，在這個例子中，我們有4個分類，所以也就有4個神經單元，它們代表了這4個分類。在softmax的作用下每個神經單元都會計算出當前樣本屬於本類的概率。如下：

如上圖，該樣本屬於第乙個分類的概率是0.842，屬於第二個分類的概率是0.042，屬於第三個分類的概率是0.002，屬於第四個分類的概率是0.114. 我們發現這些值相加等於一，因為這些值也是經過歸一化的結果。整個效果圖可以參考下面的例子，這是乙個比較直觀的圖。

既然softmax的輸出變成了多個值，那麼我們如何計算它的損失函式呢，有了損失函式我們才能進行梯度下降迭代並根據前向傳播和反向傳播進行學習。如下圖：

還是假設有4個分類，那麼實際的**向量，也會有4個維度。如上圖左邊的樣子。如果是屬於第二個分類，那麼第二個值就是1，其他值都是0。假設右邊的向量是**值，每個分類都有乙個**概率。那麼我們的損失函式就是。

由於實際值得向量只有乙個是1，其他的都是0. 所以其實到了最後的函式是下面這個樣子的

ok，有了損失函式，我們就可以跟以前做邏輯回歸一樣做梯度下降就可以了。

我們之前評價二分類的時候有混淆矩陣，auc等評估指標。在多分類中我們同樣有這些指標，只不過計算方式略有不同。就如混淆矩陣。如有150個樣本資料，這些資料分成3類，每類50個。分類結束後得到的混淆矩陣為：

其中第一行說明類1的50個樣本有43個分類正確，5個錯分為類2，2個錯分為類3。

我們再來看乙個更複雜一點的。

上面是乙個7分類，有700個樣本，每類一百個共700個樣本的混淆矩陣。我們可以通過混淆矩陣計算出準確率，同時也可以計算出每乙個分類的召回，精準和f1 score。

多分類評估指標

多分類建模評估指標

分類演算法評估指標

分類問題的評估指標

多分類評估指標

多分類建模評估指標

分類演算法評估指標

分類問題的評估指標

相關推薦