深度學習之目標檢測與目標識別

2021-08-20 11:48:59 字數 2583 閱讀 4270

目前可以將現有的基於深度學習的目標檢測與識別演算法大致分為以下

三大類: 

基於區域建議的目標檢測與識別演算法,如r-cnn, fast-r-cnn, faster-r-cnn;

基於回歸的目標檢測與識別演算法,如yolo, ssd;

基於搜尋的目標檢測與識別演算法,如基於視覺注意的attentionnet,基於強化學習的演算法.

目前, 目標識別主要有

以下幾個

應用

場景:

安全領域

指紋識別人臉識別等,代表專案如face++、依圖科技、深醒科技等。

軍事領域地形勘察飛行物識別等,代表專案全悉科技。

交通領域車牌號識別無人駕駛交通標誌識別等,代表專案縱目科技、tu******(圖森科技)、馭勢科技等。

醫療領域心電圖b超健康管理營養學等,代表專案智影醫療、圖瑪深維等。

生活領域智慧型家居購物智慧型測膚等,代表專案yi+、木薯科技、肌秘等。

2) 將提取出來的候選區域轉換為統一大小的(拉公升/壓縮等方法), 使用cnn模型提取每乙個候選區域的固定長度的特徵.

3)使用特定類別的線性svm分類器對每乙個候選區域進行分類.

4) bounding box回歸.

2) 特徵領域的微調

)個.:

:要訓練多個分類器, 訓練時間較長

測試時間長,由於每張要處理大量的目標候選框

可以參見這裡.

我們使用三層的金字塔池化層pooling,分別設定切分成多少塊,**中設定的分別是(1,4,16),然後按照層次對這個特徵圖feature a進行分別

處理(用**實現就是for(1,2,3層)),也就是在第一層對這個特徵圖feature a整個特徵圖進行池化(池化又分為:最大池化,平均池化,隨機池化),**中使用的是最大池化,

得到1個特徵。

第二層先將這個特徵圖feature a切分為4個(20,30)的小的特徵圖,然後使用對應的大小的池化核對其進行池化得到4個特徵,

第三層先將這個特徵圖feature a切分為16個(10,15)的小的特徵圖,然後使用對應大小的池化核對其進行池化得到16個特徵.

最後將這1+4+16=21個特徵輸入到全連線層,進行權重計算. 當然了,這個層數是可以隨意設定的,以及這個劃分也是可以隨意的,只要效果好同時最後能組合成我們需要的特徵個數即可.

), 同時加入了候選框對映的功能, 使得網路能夠進行反向傳播, 解決了spp的整體網路訓練的問題.

1) 接收乙個影象, 使用

selective search選擇大約2000個從上到下的類無關的

.2) 對整張進行卷積操作

提取特徵

, 得到feature map.

3) 找到每個候選框在feature map中的對映patch. 將patch作為每個候選框的特徵輸入到roi池化層及後面的層.

4) 將提取出的候選框的特徵輸入到softmax分類器中進行分類.==>替換了r-cnn的svm分類.

進行候選區域(region proposal)的選擇進行改進, 仍然不能實現真正意義上的edge-to-edge(端到端)的訓練

1. 對整張輸進cnn網路,得到feature map.

2. 卷積特徵輸入到rpn,得到候選框的特徵資訊.

3. 對候選框中提取出的特徵,使用分類器判別是否屬於乙個特定類.

4. 對於屬於某一特徵的候選框,用回歸器進一步調整其位置.

在於通過滑動視窗的方式實現候選框的提取,每個滑動視窗位置生成9個候選視窗(不同尺度、不同寬高), 提取對應9個候選視窗(anchor)的特徵,用於目標分類和邊框回歸,與fastrcnn類似。目標分類只需要區分候選框內特徵為前景或者背景。

的方式,達到接近實時的效能,交替訓練方式描述為:

faster r-cnn, 逐步實現了端到端的目標識別和檢測的網路.網路訓練和測試的效率也有了乙個較大的提公升.可以說基於region proposal的r-cnn系列目標檢測與識別演算法是當前目標最主要的乙個分支。

目標檢測與目標識別

目標識別 objec recognition 是指明一幅輸入影象中包含哪類目標。其輸入為一幅影象,輸出是該影象中的目標屬於哪個類別 class probability 目標檢測 object detection 除了要告訴輸入影象中包含哪類目標外,還要框出該目標的具體位置 bounding boxe...

目標分割 目標識別 目標檢測和目標跟蹤的區別

粗略理解 典型的技術路線是 目標分割 目標檢測 目標識別 目標跟蹤 ot與od到底啥區別 最大的區別我覺得ot只給了第一幀的gt基於od的目標跟蹤演算法計算非常昂貴,需要對每幀畫面進行檢測,才能得到目標的運動軌跡。而且,只能追蹤已知的目標,因為目標檢測演算法就只能實現已知類別的定位識別。因此,od要...

深度學習目標檢測

流程狂徒如下 1 使用selective search提取proposes,然後利用cnn等識別技術進行分類。2 使用識別庫進行預訓練,而後用檢測庫調優引數。3 使用svm代替了cnn網路中最後的softmax,同時用cnn輸出的4096維向量進行bounding box回歸。4 流程前兩個步驟 候...