多分類評估指標

2021-09-03 01:53:58 字數 1593 閱讀 3373

多分類指標的情況

二分類和多分類其實沒有多少區別。用的公式仍然是y=wx + b。 但有乙個非常大的區別是他們用的啟用函式是不同的。 邏輯回歸用的是sigmoid,這個啟用函式的除了給函式增加非線性之外還會把最後的**值轉換成在【0,1】中的資料值。也就是**值是0

我們最後的一層中使用的啟用函式就是softmax。 我們發現跟二分類在輸出層之後乙個單元不同的是, 使用softmax的輸出層擁有多個單元,實際上我們有多少個分類就會有多少個單元,在這個例子中,我們有4個分類,所以也就有4個神經單元,它們代表了這4個分類。在softmax的作用下每個神經單元都會計算出當前樣本屬於本類的概率。如下:

如上圖,該樣本屬於第乙個分類的概率是0.842, 屬於第二個分類的概率是0.042,屬於第三個分類的概率是0.002,屬於第四個分類的概率是0.114. 我們發現這些值相加等於一,因為這些值也是經過歸一化的結果。 整個效果圖可以參考下面的例子, 這是乙個比較直觀的圖。

既然softmax的輸出變成了多個值,那麼我們如何計算它的損失函式呢, 有了損失函式我們才能進行梯度下降迭代並根據前向傳播和反向傳播進行學習。如下圖:

還是假設有4個分類,那麼實際的**向量,也會有4個維度。 如上圖左邊的樣子。 如果是屬於第二個分類,那麼第二個值就是1, 其他值都是0。 假設右邊的向量是**值, 每個分類都有乙個**概率。 那麼我們的損失函式就是。

由於實際值得向量只有乙個是1,其他的都是0. 所以其實到了最後的函式是下面這個樣子的

ok,有了損失函式,我們就可以跟以前做邏輯回歸一樣做梯度下降就可以了。

我們之前評價二分類的時候有混淆矩陣,auc等評估指標。 在多分類中我們同樣有這些指標,只不過計算方式略有不同。 就如混淆矩陣。如有150個樣本資料,這些資料分成3類,每類50個。分類結束後得到的混淆矩陣為:

其中第一行說明類1的50個樣本有43個分類正確,5個錯分為類2,2個錯分為類3。

我們再來看乙個更複雜一點的。

上面是乙個7分類,有700個樣本,每類一百個共700個樣本的混淆矩陣。我們可以通過混淆矩陣計算出準確率,同時也可以計算出每乙個分類的召回,精準和f1 score。

多分類建模評估指標

作為機器學習實踐中分類領域下的乙個模組,多分類問題建模也是生產生活應用中的重要組成部分 在模型構建完成之後,對多分類模型的評估影響到後期的模型決策甚至是機器學習解決方案的實際應用效果。準確有效評估多分類模型的效能,有利於我們建立起對當前模型水平的正確認識 由此,本文著重 幾種常用的多分類模型評估指標...

分類演算法評估指標

2 準確率 accuracy 準確率是常用的乙個評價指標,但是不適合樣本不均衡的情況。ac cura cy t p tn tp t n fp fn accuracy tp tn tp tn fp fnac cura cy t p tn tp t n fp fn 3 精確率 precision 又稱查...

分類問題的評估指標

分類的評估指標有很多,這裡考慮如下幾個 precision,recall,f1,macro f1,micro f1 真實10 1tp fp0fntn positive negative 表示 的正負 true false 表示 是否正確 而macro f1和micro f1,巨集觀f1值和微觀f1值...