目標檢測常遇概念解釋

dpm演算法採用了改進後的hog特徵，svm分類器和滑動視窗（sliding windows）檢測思想，針對目標的多視角問題，採用了多元件（component）的策略，針對目標本身的形變問題，採用了基於圖結構（pictorial structure）的部件模型策略。此外，將樣本的所屬的模型類別，部件模型的位置等作為潛變數（latent variable），採用多示例學習（multiple-instance learning）來自動確定。

平均精度均值（map）是**目標位置以及類別的這一類演算法的效能度量標準。map 對於評估目標定位模型、目標檢測模型以及例項分割模型非常有用。

在模型**時，輸出的 bounding box 是有很多的，但是大部分都是置信度很小的，我們只需要輸出置信度超過某個閾值的 bounding box 。

tp —— true positive （真正, tp）是指某（些）個正樣本被**判定為正；此種情況可以稱作判斷為真的正確情況【correctly identified】。

tn —— true negative（真負 , tn）是指某（些）個負樣本被**判定為負；此種情況可以稱作判斷為假的正確情況【correctly rejected】。

fp ——false positive （假正, fp）是指某（些）個負樣本被模型**為正；此種情況可以稱作判斷為真的錯誤情況，或稱為誤報【incorrectly identified】。

fn——false negative（假負 , fn）是指某（些）個正樣本被模型**為負；此種情況可以稱作判斷為假的錯誤情況，或稱為漏報【incorrectly rejected】。

準確率和召回率是互相影響的，因為如果想要提高準確率就會把**的置信率閾值調高，所有置信率較高的**才會被顯示出來，而那一些正確正**（true positive）可能因為置信率比較低而沒有被顯示了。一般情況下準確率高、召回率就低，召回率低、準確率高，如果兩者都低，就是網路出問題了。

一般來說影響 map 的原因有很多，主要有以下幾個：

1. 不好的訓練資料。

2. 訓練資料不夠多。

3. 標註的框不準確。

4. 資料的多變性。

有的時候增加訓練資料可能 map 並不會增加多少。當然了，使用表現更好的網路，其 map 自然地也會更加的高。

iou 的全稱為交並比（intersection over union）。iou 計算的是「**的邊框」和「真實的邊框」的交集和並集的比值。

dropout layer的目的是為了防止cnn 過擬合, 在訓練過程中，將神經網路進行取樣，也就是隨機的讓神經元啟用值為0，而在測試時不再採用dropout。通常設定隨機取樣概率為0.5，也可以通過驗證集來確定取樣概率。

1.**前向傳播**

訓練階段：前向傳播給定每個神經元乙個隨機值（0~1），假定設定取樣閾值為0.5，如果該神經元對應的隨機值小於0.5，則設定該神經元為0，否則設定該神經元值為2乘以原值，（1/0.5），並把所有神經元對應的隨機值儲存下來，在後向傳播是需要使用。

測試階段：無需dropout。

2.**反向傳播**

讀取在前向傳播記錄的隨機值，同樣的操作：該梯度值對應的隨機值小於0.5，則設定該梯度值為0，否則設定該梯度值為2乘以原值，（1/0.5）。

非極大值抑制，簡稱為nms演算法，英文為non-maximum suppression。其思想是搜素區域性最大值，抑制極大值。

目標檢測的過程中在同一目標的位置上會產生大量的候選框，這些候選框相互之間可能會有重疊，此時我們需要利用非極大值抑制找到最佳的目標邊界框，消除冗餘的邊界框。

左圖是人臉檢測的候選框結果，每個邊界框有乙個置信度得分(confidence score)，如果不使用非極大值抑制，就會有多個候選框出現。右圖是使用非極大值抑制之後的結果，符合我們人臉檢測的預期結果。

前提：目標邊界框列表及其對應的置信度得分列表，設定閾值，閾值用來刪除重疊較大的邊界框。iou：intersection-over-union，即兩個邊界框的交集部分除以它們的並集。

非極大值抑制的流程如下：

· 根據置信度得分進行排序

· 選擇置信度最高的邊界框新增到最終輸出列表中，將其從邊界框列表中刪除

· 計算所有邊界框的面積

· 計算置信度最高的邊界框與其它候選框的iou

· 刪除iou大於閾值的邊界框

· 重複上述過程，直至邊界框列表為空。

假設在乙個單類別檢測問題中的樣本有兩類（背景算1類）。background false positive就是把background錯誤檢測為正樣本框的數量。

roi（region of interest），感興趣區域。機器視覺、影象處理中，從被處理的影象以方框、圓、橢圓、不規則多邊形等方式勾勒出需要處理的區域，稱為感興趣區域，roi。

在影象處理領域，感興趣區域(roi) 是從影象中選擇的乙個影象區域，這個區域是你的影象分析所關注的重點。圈定該區域以便進行進一步處理。使用roi圈定你想讀的目標，可以減少處理時間，增加精度。

目標檢測常遇概念解釋

目標檢測入門目標檢測基本概念

目標檢測 mAP的概念

關於目標檢測中的AP，mAP解釋

目標檢測常遇概念解釋

目標檢測入門 目標檢測基本概念

目標檢測 mAP的概念

關於目標檢測中的AP，mAP解釋

相關推薦

目標檢測入門目標檢測基本概念