資料探勘之分類指標

場景如下：

假設原樣本有兩類，true和false，其中：

1.總共有t個類別為true的樣本；

2.總共有f個類別為false的樣本；

分類**後：

1.總共有tt個類別為true的樣本被系統判為true，ft個類別為true的樣本被系統判為false，則tt+ft=t

2.總共有ff個類別為false的樣本被系統判為false，tf個類別為false的樣本被系統判為true，則ff+tf=f

指標計算：

精確度=tt/(tt+tf)--判斷正樣本中真正正樣本的比例

準確率=(tt+ff)/(t+f)--判斷正確的比重

召回率=tt/(tt+ft)--正確判斷正例的比重

漏報率=ft/(tt+ft)--多少個正例被漏判了

虛警率=tf/(tt+tf)--

反映被判為正例樣本中，有多少個是負例

靈敏度=tt/(tt+ft)

特異度=ff/(ff+tf)

【靈敏度=真陽性人數/（真陽性人數+假陰性人數）×100%。正確判斷病人的率。

特異度=真陰性人數/（真陰性人數+假陽性人數）×100%。正確判斷非病人的率。】

英文標示：

召回率 recall；

精確度precision；

準確率accuracy；

漏警概率（missing alarm）；

虛警概率（false alarm）；

資料探勘之分類

分類的定義通過學習得到目標函式f 也叫分類模型把每個屬性集x對映到乙個預先定義好的類稱號y。相關定義訓練集屬性類標號模型測試集分類與聚類的區別聚類無指導的學習，事先沒有標籤，而通過某種成因分析找出事物之間存在聚集性原因的過程。面對一堆資料，將這堆資料分成幾類分類有指導的學習...

資料探勘之分類

分類是構造乙個分類模型，輸入樣本的屬性值，輸出對應的類別，將每個樣本對映到預先定義好的類別。分類的演算法分為以下兩步 1 學習步，通過歸納分析訓練樣本集，來建立分類模型，得到分類規則 2 分類步，先用已知的測試樣本集評估分類規則的準確率，如果準確率是可以接受的，則使用該模型對未知類標號的待測樣本集進...

資料探勘之分類演算法

分類是資料探勘機器學習和模式識別中乙個重要的研究領域。單一的分類方法主要包括決策樹貝葉斯人工神經網路 k 近鄰支援向量機和基於關聯規則的分類等還有用於單一分類方法的整合學習演算法，如bagging和boosting等。1 決策樹主要用於分類和的技術之一，是以例項為基礎的歸納學習演算法...

資料探勘之分類指標

資料探勘之分類

資料探勘之分類

資料探勘之分類演算法

相關推薦