深度學習之目標檢測與目標識別

目前可以將現有的基於深度學習的目標檢測與識別演算法大致分為以下

三大類：

①基於區域建議的目標檢測與識別演算法，如r-cnn, fast-r-cnn, faster-r-cnn;

②基於回歸的目標檢測與識別演算法，如yolo, ssd;

③基於搜尋的目標檢測與識別演算法，如基於視覺注意的attentionnet，基於強化學習的演算法.

目前, 目標識別主要有

以下幾個

應用

場景:

①安全領域

：指紋識別、人臉識別等，代表專案如face++、依圖科技、深醒科技等。

②軍事領域：地形勘察、飛行物識別等，代表專案全悉科技。

③交通領域：車牌號識別、無人駕駛、交通標誌識別等，代表專案縱目科技、tu******（圖森科技）、馭勢科技等。

④醫療領域：心電圖、b超、健康管理、營養學等，代表專案智影醫療、圖瑪深維等。

⑤生活領域：智慧型家居、購物、智慧型測膚等，代表專案yi+、木薯科技、肌秘等。

2) 將提取出來的候選區域轉換為統一大小的(拉公升/壓縮等方法), 使用cnn模型提取每乙個候選區域的固定長度的特徵.

3)使用特定類別的線性svm分類器對每乙個候選區域進行分類.

4) bounding box回歸.

2) 特徵領域的微調

)個.:

:要訓練多個分類器, 訓練時間較長

測試時間長，由於每張要處理大量的目標候選框

可以參見這裡.

我們使用三層的金字塔池化層pooling，分別設定切分成多少塊，**中設定的分別是(1,4,16),然後按照層次對這個特徵圖feature a進行分別

處理（用**實現就是for(1,2,3層)）,也就是在第一層對這個特徵圖feature a整個特徵圖進行池化(池化又分為：最大池化，平均池化，隨機池化),**中使用的是最大池化,

得到１個特徵。

第二層先將這個特徵圖feature a切分為4個(20,30)的小的特徵圖，然後使用對應的大小的池化核對其進行池化得到４個特徵，

第三層先將這個特徵圖feature a切分為16個(10,15)的小的特徵圖，然後使用對應大小的池化核對其進行池化得到16個特徵.

最後將這１＋４＋１６＝２１個特徵輸入到全連線層，進行權重計算. 當然了，這個層數是可以隨意設定的，以及這個劃分也是可以隨意的，只要效果好同時最後能組合成我們需要的特徵個數即可.

), 同時加入了候選框對映的功能, 使得網路能夠進行反向傳播, 解決了spp的整體網路訓練的問題.

1) 接收乙個影象, 使用

selective search選擇大約2000個從上到下的類無關的

.2) 對整張進行卷積操作

提取特徵

, 得到feature map.

3) 找到每個候選框在feature map中的對映patch. 將patch作為每個候選框的特徵輸入到roi池化層及後面的層.

4) 將提取出的候選框的特徵輸入到softmax分類器中進行分類.==>替換了r-cnn的svm分類.

進行候選區域(region proposal)的選擇進行改進, 仍然不能實現真正意義上的edge-to-edge(端到端)的訓練

1. 對整張輸進cnn網路，得到feature map.

2. 卷積特徵輸入到rpn，得到候選框的特徵資訊.

3. 對候選框中提取出的特徵，使用分類器判別是否屬於乙個特定類.

4. 對於屬於某一特徵的候選框，用回歸器進一步調整其位置.

在於通過滑動視窗的方式實現候選框的提取，每個滑動視窗位置生成9個候選視窗(不同尺度、不同寬高), 提取對應9個候選視窗（anchor）的特徵，用於目標分類和邊框回歸，與fastrcnn類似。目標分類只需要區分候選框內特徵為前景或者背景。

的方式，達到接近實時的效能，交替訓練方式描述為：

faster r-cnn, 逐步實現了端到端的目標識別和檢測的網路.網路訓練和測試的效率也有了乙個較大的提公升.可以說基於region proposal的r-cnn系列目標檢測與識別演算法是當前目標最主要的乙個分支。

深度學習之目標檢測與目標識別

目標檢測與目標識別

目標分割目標識別目標檢測和目標跟蹤的區別

深度學習目標檢測

深度學習之目標檢測與目標識別

目標檢測與目標識別

目標分割 目標識別 目標檢測和目標跟蹤的區別

深度學習目標檢測

相關推薦

目標分割目標識別目標檢測和目標跟蹤的區別