機器學習學習中評價模型好壞的標準

2021-08-02 02:22:15 字數 754 閱讀 2132

準確率（accuracy）：這個公式計算比較簡單，就是**正確的樣本數量除以總的樣本數量

但是很多時候，這個往往不能滿足要求，比如樣本不平衡，比如我們更加關心另一類的**情況，這就會有問題，比如你的樣本不均衡，以兩類問題為例：如果+1為10000，-1為50，那麼只要過擬合，即使-1全部分錯，正確率也是非常高的。如果我們更加關心-1的分類情況，這也沒法實現。所以引入了另外的指標

準確率（accuracy）：(#（true positive) + # (true negative) ) / (#（true positive) + # (true negative) + #（false positive) + # (false negative))

召回率（recall）：#（true positive) / (#（true positive) + #（false positive) )

精確率（precision）：#（true positive) / (#（true positive) + #（false negative) )

f1: （a*a+1）*recall*precision/（a*a*(recall+precision)）

a用於衡量召回率和精確率兩者之間的重要，如果等於1，表示一樣重要。

#（true positive) ：代表第一類正確分類的樣本數量。#（true negative)：代表第二類分類正確的樣本。#（false positive) ：第二類誤認為第一類的樣本。 # (false negative)：表示第一類誤認為第二類的樣本數量。

機器學習模型知乎機器學習模型選擇與評價

交叉驗證首先選擇模型最簡單的方法就是，利用每一種機器學習演算法邏輯回歸 svm 線性回歸等計算訓練集的損失值，然後選擇其中損失值最小的模型，但是這樣是不合理的，因為當訓練集不夠特徵過多時容易過擬合，那麼訓練集的損失值就會不斷變小，但是此時針對測試集可能損失值很高，所以訓練集上的損失值是無法衡...

機器學習模型評價指標混淆矩陣

在機器學習領域中，混淆矩陣 confusion matrix 是一種評價分類模型好壞的形象化展示工具。其中，矩陣的每一列表示的是模型的樣本情況矩陣的每一行表示的樣本的真實情況。1.混淆矩陣的舉例例如用乙個分類模型來判別乙個水果是蘋果還是梨，混淆矩陣將會模型的結果總結成如下表所示的模型結果...

機器學習模型評價和優化方法

機器學習中的高偏差指的是模型的損失函式校驗中，訓練集和測試集error大，模型欠擬合高方差是指訓練集的error小，測試集的error大，模型過擬合。通俗來說，高偏差問題就是採用訓練集訓練效果都不太好的模型，而高偏差問題就是訓練效果好，但是測試效果不好的模型，繪製學習曲線有助於了解演算法是高偏差問...