機器學習備忘錄 二分類模型常用評價指標彙總

2021-08-20 17:08:42 字數 454 閱讀 3118

在二分類問題中,資料的標籤通常用(0/1)來表示,在模型訓練完成後進行測試時,會對測試集的每個樣本計算乙個介於0~1之間的概率,表徵模型認為該樣本為陽性的概率,我們可以選定乙個閾值,將模型計算出的概率進行二值化,比如選定閾值=0.5,那麼當模型輸出的值大於等於0.5時,我們就認為模型將該樣本**為陽性,也就是標籤為1,反之亦然。選定的閾值不同,模型**的結果也會相應地改變。二元分類模型的單個樣本**有四種結果:

真陽性(tp):判斷為陽性,實際也是陽性。

偽陽性(fp):判斷為陽性,實際卻是陰性。

真陰性(tn):判斷為陰性,實際也是陰性。

偽陰性(fn):判斷為陰性,實際卻是陽性。

這四種結果可以畫成2 × 2的混淆矩陣

有了混淆矩陣,就可以定義各種指標了。

2018-06-12

機器學習二分類精度

針對二分類的結果,對模型進行評估,通常有以下幾種方法 初始作如下定義 真實結果10 結果 1tp 真陽性 fp 假陽性 0fn 假陰性 tn 真陰性 precision 準確率 可以理解為 結果為正類中有多少是正類,給出定義如下 recall 召回率 可以理解為真實結果為正類中有多少被 成正類,給出...

二分類模型評估

分類演算法最常見的指標是分類準確率 accuracy 而當樣本中的分類極度不均衡時,accuracy不能說明問題 例如在100個觀測樣本中,有95個0,5個1,全部 為0,accuracy是95 已經很高了 一般我們用混淆矩陣 confusion matrix 來描述二分類的好壞,也通過此矩陣衍生出...

機器學習 回歸二分類demo

一基礎知識 1.tensorflow使用張量表示資料,使用 圖 表示計算任務,使用會話來執行圖。dtype和shape是張量的屬性 import tensorflow as tf 基礎知識 t1 tf.constant 10,dtype tf.int32 sess tf.session print ...