機器學習模型三大評估指標準確率精度召回率

二分類任務中用準確率、精度和召回率三大指標評估模型效能，在介紹這些概念之前先介紹混淆矩陣的概念。二分類的混淆矩陣包含四個值：真正例（tp）、假正例（fp）、真反例（tn）、假反例（fn）。如果將乙個資料點**為正例，但它實際是反例，那麼它就是乙個假正例。

混淆矩陣

真實值positive

negative

預

測

值

positive

true positive

false positive

negative

false negative

true negative

示例場景：100個人中有5個****，我們要用乙個模型識別出哪些是****，此時****即為正例，非****是負例。

定義：在**的結果中所有被正確**的正類和正確**的負類的和佔總體樣本數的比重

accuracy = (tp + tn)/(tp + tn + fp + fn)

優點：最符合常人理解的評估指標

缺點：對於非常不平衡的資料集來說，比如以上場景，乙個模型只要將這100個人全部**為非****，那麼準確率就達到了95%，在這樣不平衡的資料集中應聚焦正例（****）的識別，而不是負例（非****）的識別。

定義：針對原來樣本而言，它表示樣本正類中有多少被**正確了，那也有兩種可能，一種是把原來的正類**成正類，一種是把原來的正類**成負類。在****檢測的例子中，tp是被正確識別的****，fn 是模型誤分類為非****的****的資料點

recall = tp / (tp + fn)

優點：表達了模型找到資料集中所有感興趣的資料點的能力

缺點：如果我們將所有人都標記為****，那麼此時模型的召回率是1.0，顯然不行

定義：精確率是針對我們**結果而言的，它表示的是**為正的樣本中有多少時對的，那麼**為正就有兩種可能了，一種就是把正類的**為正的，另一種就是把負類**為正類。在****檢測中，tp是被正確標記的****，fp是被被錯誤標記為****的非****

precision = tp / (tp + fp)

缺點：如果我們的模型只要將乙個****正確識別為****，其他99個人都標記為非****，那麼此時精度為1.0，因為沒有假正例（fp=0），但是此時的召回率卻很低，只有20%

根據2.2和2.3的介紹可以發現，隨著精度的增加，召回率會降低，反之亦然。因此我們要想找到精度和召回率的最佳組合，可以使用f1 score來對兩者進行結合。

f1 = 2 * precision * recall / (precision + recall)

使用調和平均而不是算術平均在於：調和平均可以懲罰極端情況。乙個具有 1.0 的精度，而召回率為 0 的分類器，這兩個指標的算術平均是 0.5，但是 f1 score 會是 0。f1 score 給了精度和召回率相同的權重，它是通用 fβ指標的乙個特殊情況，在 fβ中，β 可以用來給召回率和精度更多或者更少的權重。如果我們想建立乙個具有最佳的精度—召回率平衡的模型，那麼就要嘗試將 f1 score 最大化。

roc曲線即受試者特徵曲線（receiver operating characteristic curve），它展示了當改變在模型中識別為正例的閾值改變時，召回率和精度的關係會如何變化。roc 曲線在 y 軸上畫出了真正例率（tpr），在 x 軸上畫出了假正例率 (fpr)。其中tpr即為召回率，fpr是負例被**為正例的概率

tpr = tp / (tp + fn)

fpr = fp / (fp + tn)

下圖給乙個roc曲線示例

黑色是隨機分類器，每個給定的模型只能對應一條曲線，通過調整對正例進行分類的閾值來沿著曲線移動，降低閾值時向右上方移動。在閾值為 1.0 的情況下，我們將位於圖的左下方，因為沒有將任何資料點識別為正例，這導致沒有真正例，也沒有假正例（tpr = fpr = 0）。當降低閾值時，我們將更多的資料點識別為正例，導致更多的真正例，但也有更多的假正例 ( tpr 和 fpr 增加)。最終，在閾值 0.0 處，我們將所有資料點識別為正，並發現位於 roc 曲線的右上角 ( tpr = fpr = 1.0 )。

auc是曲線下面積，用來量化模型的roc曲線。這是乙個介於 0 和 1 之間的度量，數值越大，表示分類效能越好。在上圖中，藍色曲線的 auc 將大於紅色曲線的 auc，這意味著藍色模型在實現準確度和召回率的權衡方面更好。隨機分類器 (黑線) 實現 0.5 的 auc。

參考：

機器學習模型三大評估指標準確率精度召回率

提高機器學習模型準確率的八大方法

提高機器學習模型準確率的八大方法

機器學習KNN識別準確率 2

機器學習模型三大評估指標 準確率 精度 召回率

提高機器學習模型準確率的八大方法

提高機器學習模型準確率的八大方法

機器學習KNN識別準確率 2

相關推薦

機器學習模型三大評估指標準確率精度召回率