深度學習與計算機視覺八

1.滑窗法

思路很簡單，首先需要乙個已經訓練好的分類器，然後把影象按照一定間隔和不同的大小分成乙個個視窗，在這些視窗上執行分類器，如果得到較高的分類分數，就認為是檢測到了物體，把每個視窗都用分類器執行一遍之後，再對得到的分數做一些後處理的操作。

2.pascal voc .map和iou簡介

他是一套用於評估影象分類，檢測，分割和人體姿勢動作等的資料集。其中用的最多的就是物體檢測，包含4大類和20個細分類別，評價乙個檢測演算法，主要就是看兩個標準，也就是是否正確**了框內的物體類別：**的框和人工標註框的重合程度，他們的量化指標分別是map和iou，map也就是平均精度均值，他把每個類別的ap都單獨拎出來，然後計算所有類別ap的平均值，代表著對檢測到的目標平均精度的乙個綜合評價，iou是用來衡量**的物體框和真實框的重合程度。

3.selective search和r-cnn簡介

他的思路就是，可能存在物體的區域都應該是有某種相似性的或連續的區域，針對這兩個特點，採用超畫素合併的思路，首先用分割演算法再影象上產生很多的小區域，或者看做是超畫素，再根據這些區域之間的相似性進行區域合併，成為大一點的區域。

他的第乙個優點就是高效，因為不再是漫無目的的窮舉式搜尋，第二個優點就是由於採用了多樣的指標，提公升了找到物體的可靠性。

4.spp,roi pooling 和fast r-cnn簡介這個的思路就是，對整張執行一次卷積神經網路的前向計算，到了最後一層的啟用響應圖時，通過某種方式把目標物體所在區域部分的響應圖拿出來作為特徵給分類器。

5.yolo和ssd簡介

他能**多種：

1.物體框，包含物體框中心相對格仔中心的座標（x,y）和物體框的寬w和高h

2.每個物體框是否有物體的置信度，其中當前這個格仔如何包含物體，則置信度的分數為當前**的物體框和標註物體框的iou。

3.每個格仔**一共c個類別的概率分數，並且這個分數和物體框是不相關的，只是基於這個格仔。

yolo在速度上獲得了很大的提公升，但精度上比rcnn系還是遜色一些，其中乙個原因是基於格仔回歸物體框的方式在一定程度上限制了物體框位置和大小的靈活性。

而ssd算是同時借鑑了yolo和fr-cnn的思想，在達到實時的檢測速度水平下，保持很高的檢測精度，ssd也會在卷積神經網路的最後階段，保持很高的檢測精度。

1.距離和度量學習

在機器學習中，有一類演算法如k近鄰/k-means,svm,相似比對的演算法，非常依賴距離這個度量來對資料執行分類等任務，所以有乙個方向專門研究如何讓乙個演算法更好的學習到一種度量，比如歐式距離，提公升特定任務的演算法效能，這就是度量學習。

1.1歐式距離和馬式距離

1.2歐式距離和余弦距離

1.3非線性度量學習和siamese網路

很多代表性的度量學習的方法都是基於線性變換去做的，這個的優點就是學習出來的metric不容易過擬合，求解很快，但是缺點就是擬合能力往往不夠，對輸入樣本的特徵可分性要求也很高。

深度學習與計算機視覺八

計算機視覺與深度學習公司

深度學習與計算機視覺六

計算機視覺深度學習基礎

深度學習與計算機視覺八

計算機視覺與深度學習公司

深度學習與計算機視覺六

計算機視覺 深度學習基礎

相關推薦

計算機視覺深度學習基礎