統計建模 分類效能評價(混淆矩陣和ROC曲線)

2021-10-02 03:31:46 字數 1847 閱讀 9824

在資料本身嚴重有偏的情況下,準確率很容易達到乙個很高的數值,因此需要尋找另外的效能評價方法。

混淆矩陣:將資料按待分的類別分組後,統計各組中模型分類或**結果的矩陣

)#可直接獲取鳶尾花資料集

plt.figure(figsize=(12

,15))

for n in

range(4

):print

(n)for m in

range(3

):x=

(iris.data[m*

50:m*50+

50,n]

-iris.data[m*

50:m*50+

50,n]

.mean())

/ iris.data[m*

50:m*50+

50,n]

.std(

) plt.subplot(4,

3, n*

3+ m +1)

stats.probplot(x, dist=

'norm'

, plot=plt)

plt.text(-2

,2,iris.feature_names[n]

)if n ==0:

plt.title(iris.target_names[m]

)else

: plt.title('')

plt.xlim([-

2.5,

2.5]

) plt.ylim([-

2.5,

2.5]

) plt.plot([-

2.5,

2.5],[

-2.5

,2.5

],c=

'g')

from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target,test_size=

0.2,random_state=0)

from sklearn.*****_bayes import gaussiannb

clf=gaussiannb(

)clf.fit(x_train, y_train)

y_pred=clf.predict(x_test)

y = pd.dataframe(np.transpose(

[y_test, y_pred]

), columns=

)from sklearn.metrics import confusion_matrix

print

(confusion_matrix(y_pred, y_test)

)from sklearn.metrics import classification_report

print

(classification_report(y_pred, y_test)

)

混淆矩陣評價指標 分類效果評價指標一混淆矩陣

1.混淆矩陣 判斷分類模型好壞 混淆矩陣是roc曲線繪製的基礎,同時它也是衡量分型別模型準確度中最基本,最直觀,計算最簡單的方法。一句話解釋版本 混淆矩陣就是分別統計分類模型歸錯類,歸對類的觀測值個數,然後把結果放在乙個表裡展示出來。這個表就是混淆矩陣。混淆矩陣是評判模型結果的指標,屬於模型評估的一...

多分類任務的混淆矩陣和評價指標

之前一直不明白多分類任務的混淆矩陣,今天研究了一下。拿乙個三分類任務來說 cat dog bird 有8個 結果 值 dog,dog,cat cat,cat,dog,bird,cat 真實值 dog,cat,cat,cat,bird,bird,cat,cat 要對每乙個類別做混淆矩陣。拿cat類來說...

分類器評估 混淆矩陣和ROC曲線

為正樣本 1 為負樣本 1 原正樣本 1 真陽 tp 假陰 fn 原負樣本 1 假陽 fp 真陰 tn 這裡以二分類問題來討論 很明顯,理想完美的分類器的對角線為0,即所有正樣本 為正樣本,所有負樣本 為負樣本。由混淆矩陣可以得出的一些引數 1 accuracy 模型的精度,模型 正確個數 樣本的總...