精度召回率準確率 F score

文字分類的評價指標一般採用精度（precision）、召回率（recall）、f-score和準確率（accuracy）

**正例

**反例

實際正例

tpfn

實際反例

fptn

其中tp：true positive 表示實際為正例、**也為正例的樣本數量；fn：false negative 實際為正例、結果**為反例的樣本；fp：false positive：實際反例但是**是正例的樣本數量；tn：true negative 實際反例**也是反例的樣本數量。

$$precision=\frac

$$簡化為

$$precision=\frac

$$理解為：精度=實際正例並且**也為正例/實際正例**為正例+實際反例但是**為正例的和

$$recall = \frac

$$簡化：

$$recall = \frac

$$理解：

$$召回率=\frac

$$$$

accuracy = \frac

$$這個很好理解，就是實際上**和實際結果正確的樣本數量和全部的比重

實際應用時, 需要平衡精度和召回率, 通常使用兩者的調和平均數作為乙個綜合的評價指標, 稱之為f-score

$$f-score = \frac

$$1. 準確率

雖然準確率能夠判斷總的正確率，但是在樣本不均衡的情況下，並不能作為很好的指標來衡量結果。

比如在樣本集中，正樣本有90個，負樣本有10個，樣本是嚴重的不均衡。對於這種情況，我們只需要將全部樣本**為正樣本，就能得到90%的準確率，但是完全沒有意義。對於新資料，完全體現不出準確率。因此，在樣本不平衡的情況下，得到的高準確率沒有任何意義，此時準確率就會失效。所以，我們需要尋找新的指標來評價模型的優劣。

2 . 精確率

精確率(precision) 是針對**結果而言的，其含義是在被所有**為正的樣本中實際為正樣本的概率，精確率和準確率看上去有些類似，但是是兩個完全不同的概念。精確率代表對正樣本結果中的**準確程度，準確率則代表整體的**準確程度，包括正樣本和負樣本。

3. 召回率

召回率(recall) 是針對原樣本而言的，其含義是在實際為正的樣本中被**為正樣本的概率。

準確率和召回率互相影響，理想狀態下肯定追求兩個都高，但是實際情況是兩者相互「制約」：追求準確率高，則召回率就低；追求召回率高，則通常會影響準確率。我們當然希望**的結果precision越高越好， recall越高越好，但事實上這兩者在某些情況下是矛盾的。這樣就需要綜合考慮它們，最常見的方法就是f-score。也可以繪製出p-r曲線圖，觀察它們的分布情況。

4. f-score

一般來說準確率和召回率呈負相關，乙個高，乙個就低，如果兩個都低，一定是有問題的。一般來說，精確度和召回率之間是矛盾的，這裡引入f1-score作為綜合指標，就是為了平衡準確率和召回率的影響，較為全面地評價乙個分類器。f1是精確率和召回率的調和平均。

文字分類的評價指標基於word2vec的微博短文本分類研究張謙高章敏劉嘉勇四川大學電子資訊學院

部落格準確率、精確率、召回率和f-score

精度召回率準確率 F score

準確率精確率召回率 F score比較

準確率召回率

準確率精確率召回率

精度 召回率 準確率 F score

準確率 精確率 召回率 F score比較

準確率召回率

準確率 精確率 召回率

相關推薦

精度召回率準確率 F score

準確率精確率召回率 F score比較

準確率精確率召回率