目標檢測 Object Detection

2021-09-05 09:34:22 字數 1190 閱讀 5796

目標檢測(object detection)的任務是找出影象中所有感興趣的目標(物體),確定它們的類別和位置,是計算機視覺領域的核心問題之一。由於各類物體有不同的外觀,形狀,姿態,加上成像時光照,遮擋等因素的干擾,目標檢測一直是計算機視覺領域最具有挑戰性的問題。

計算機視覺中關於影象識別有四大類任務:

定位-location:解決「在**?」的問題,即定位出這個目標的的位置。

檢測-detection:解決「是什麼?在**?」的問題,即定位出這個目標的的位置並且知道目標物是什麼。

分割-segmentation:分為例項的分割(instance-level)和場景分割(scene-level),解決「每乙個畫素屬於哪個目標物或場景」的問題。

目標檢測要解決的核心問題是:

1.目標可能出現在影象的任何位置。

2.目標有各種不同的大小。

3.目標可能有各種不同的形狀。

如果用矩形框來定義目標,則矩形有不同的寬高比。由於目標的寬高比不同,因此採用經典的滑動視窗+影象縮放的方案解決通用目標檢測問題的成本太高。

基於深度學習的目標檢測演算法主要分為兩類:

1.two stage目標檢測演算法

先進行區域生成(region proposal,rp)(乙個有可能包含待檢物體的預選框),再通過卷積神經網路進行樣本分類。

任務:特徵提取—>生成rp—>分類/定位回歸。

常見的two stage目標檢測演算法有:r-cnn、spp-net、fast r-cnn、faster r-cnn和r-fcn等。

2.one stage目標檢測演算法

不用rp,直接在網路中提取特徵來**物體分類和位置。

任務:特徵提取—>分類/定位回歸。

常見的one stage目標檢測演算法有:overfeat、yolov1、yolov2、yolov3、ssd和retinanet等。

1.two stage目標檢測演算法

r-cnn:

fast r-cnn:

faster r-cnn:

r-fcn:

fpn:

mask r-cnn:

2.one stage目標檢測演算法

ssd:

目標檢測 目標檢測通用框架總結

目標檢測框架個人總結 以下是筆記中包含的內容 目標檢測網路框架總結 yolov4中有圖 從最開始的神經網路到現在深度更深,模組更多的目標檢測深度學習神經網路,如今大致可以分為two stage detector 典型的為rcnn系列 和 one stage detector 典型為yolo系列 每個...

目標檢測入門 目標檢測基本概念

目標檢測關注影象中特定的物體目標,要求同時獲得這一目標的類別資訊和位置資訊。檢測給出的是對前景和背景的理解,需要從背景中分離出感興趣的目標,並確定這一目標的描述 類別和位置,常用檢測框表示 與影象分類的區別,目標檢測更具難度 影象分類只需要判斷輸入的影象中是否包含感興趣物體,而不需要定位具體位置 如...

運動目標檢測

目錄 檢測方法 背景模型 目標檢測 後處理 檢測方法 基於統計背景模型的運動目標檢測方法 問題 1 背景獲取 需要在場景存在運動目標的情況下獲得背景影象 2 背景擾動 背景中可以含有輕微擾動的物件,如樹枝 樹葉的搖動,擾動部分不應該被看做是前景運動目標 3 外界光照變化 一天中不同時間段光線 天氣等...