2017cvpr 目標檢測

2021-08-18 21:47:58 字數 3951 閱讀 7806

(1)speed/accuracy trade-offs for modern convolutional object detectors

其主要考慮三種檢測器(faster rcnn,r-fcn,ssd)作為元結構,三種cnn網路(vgg,inception,resnet)作為特徵提取器,變化其他引數如影象解析度、proposals數量等,研究目標檢測系統準確率與速度的權衡關係。

(2)yolo9000:better, faster, stronger

其為yolo公升級版,其對yolo方法作了一些改進,better方面考慮(batch normalization, high resolution, anchor boxes, dimension clusters, direct location prediction, fine-grained features, multi-scale training),faster方面提出乙個新的darknet-19結構。除此之外,其提出乙個方法在目標檢測資料集與影象分類資料集上聯合訓練,主要構建了乙個視覺內容分層樹結構wordtree。

(3)a-fast-rcnn: hard positive generation via adversary for object detection

其主要考慮學習乙個對於遮擋和形變具有不變性的目標檢測器,收集各種狀態目標的大資料集的資料驅動策略存在一定問題,比如遮擋和形變服從長尾理論,因此提出學習乙個對抗網路(astn,asdn)生成具有遮擋和形變的困難樣本,通過生成器與檢測器的博弈,提公升目標檢測器對於各種狀態物體的整體目標檢測效能。

(4)feature pyramid networks for object detection

其主要考慮利用深度卷積網路固有的多尺度金字塔形層次結構來構建特徵金字塔,建立了乙個具有橫向連線的自頂向下架構用於在所有尺度上構建高階語義特徵圖,fpn作為通用特徵提取器表現優異,**研究表明,儘管深度convnets具有強大的表達能力和對尺度變化內在的魯棒性,使用金字塔表示來明確地解決多尺度問題仍然是重要的。

(5)ron: reverse connection with objectness prior networks for object detection

其主要考慮兩個問題,多尺度目標定位和負樣本挖掘,並分別提出reverse connection使得網路能在cnn多尺度檢測目標和objectness prior減少目標的搜尋空間,最後通過多工損失聯合優化reverse connection、objectness prior和目標檢測器。

(6)accurate single stage detector using recurrent rolling convolution

其提出乙個新型端到端訓練目標檢測網路,在多尺度特徵圖引入recurrent rolling convolution結構建立「deep in context」的分類器和回歸器,其主要也是考慮「top-down/bottom-up」的特徵整合。

(7)mimicking very efficient network for object detection

當前目標檢測器都需要從預訓練imagenet分類模型初始化,其相比從零開始訓練能達到更好的效果,而預訓練影象分類模型對於檢測任務並非最優的,其主要考慮訓練高效檢測器而不需要imagenet的預訓練。其研究已有的乙個滿足檢測表現的網路如何指導其他網路的訓練,即利用乙個檢測網路監督另乙個更高效的網路並保持準確率,其提出特徵mimic技術。

(8)perceptual generative adversarial networks for small object detection

小目標因其低解析度和雜訊表示檢測困難,現有方法主要考慮在多尺度學習所有目標的特徵表示,其受限於計算複雜度。其主要考慮建立單個架構來解決小目標檢測問題,該架構將小目標的表示提公升到「super-resolved」,從而實現與大目標類似的特徵,從而對於檢測任務更加具有辨別能力。利用生成式對抗網路,其提出perceptual gan模型,通過縮小小目標與大目標的表示差異來改善小目標檢測。

cvpr2017目標檢測

(1)speed/accuracy trade-offs for modern convolutional object detectors

其主要考慮三種檢測器(faster rcnn,r-fcn,ssd)作為元結構,三種cnn網路(vgg,inception,resnet)作為特徵提取器,變化其他引數如影象解析度、proposals數量等,研究目標檢測系統準確率與速度的權衡關係。

(2)yolo9000:better, faster, stronger

其為yolo公升級版,其對yolo方法作了一些改進,better方面考慮(batch normalization, high resolution, anchor boxes, dimension clusters, direct location prediction, fine-grained features, multi-scale training),faster方面提出乙個新的darknet-19結構。除此之外,其提出乙個方法在目標檢測資料集與影象分類資料集上聯合訓練,主要構建了乙個視覺內容分層樹結構wordtree。

(3)a-fast-rcnn: hard positive generation via adversary for object detection

其主要考慮學習乙個對於遮擋和形變具有不變性的目標檢測器,收集各種狀態目標的大資料集的資料驅動策略存在一定問題,比如遮擋和形變服從長尾理論,因此提出學習乙個對抗網路(astn,asdn)生成具有遮擋和形變的困難樣本,通過生成器與檢測器的博弈,提公升目標檢測器對於各種狀態物體的整體目標檢測效能。

(4)feature pyramid networks for object detection

其主要考慮利用深度卷積網路固有的多尺度金字塔形層次結構來構建特徵金字塔,建立了乙個具有橫向連線的自頂向下架構用於在所有尺度上構建高階語義特徵圖,fpn作為通用特徵提取器表現優異,**研究表明,儘管深度convnets具有強大的表達能力和對尺度變化內在的魯棒性,使用金字塔表示來明確地解決多尺度問題仍然是重要的。

(5)ron: reverse connection with objectness prior networks for object detection

其主要考慮兩個問題,多尺度目標定位和負樣本挖掘,並分別提出reverse connection使得網路能在cnn多尺度檢測目標和objectness prior減少目標的搜尋空間,最後通過多工損失聯合優化reverse connection、objectness prior和目標檢測器。

(6)accurate single stage detector using recurrent rolling convolution

其提出乙個新型端到端訓練目標檢測網路,在多尺度特徵圖引入recurrent rolling convolution結構建立「deep in context」的分類器和回歸器,其主要也是考慮「top-down/bottom-up」的特徵整合。

(7)mimicking very efficient network for object detection

當前目標檢測器都需要從預訓練imagenet分類模型初始化,其相比從零開始訓練能達到更好的效果,而預訓練影象分類模型對於檢測任務並非最優的,其主要考慮訓練高效檢測器而不需要imagenet的預訓練。其研究已有的乙個滿足檢測表現的網路如何指導其他網路的訓練,即利用乙個檢測網路監督另乙個更高效的網路並保持準確率,其提出特徵mimic技術。

(8)perceptual generative adversarial networks for small object detection

小目標因其低解析度和雜訊表示檢測困難,現有方法主要考慮在多尺度學習所有目標的特徵表示,其受限於計算複雜度。其主要考慮建立單個架構來解決小目標檢測問題,該架構將小目標的表示提公升到「super-resolved」,從而實現與大目標類似的特徵,從而對於檢測任務更加具有辨別能力。利用生成式對抗網路,其提出perceptual gan模型,通過縮小小目標與大目標的表示差異來改善小目標檢測。

CVPR2017 最新目標檢測相關

1 speed accuracy trade offs for modern convolutional object detectors 其主要考慮三種檢測器 faster rcnn,r fcn,ssd 作為元結構,三種cnn網路 vgg,inception,resnet 作為特徵提取器,變化其他...

CVPR 2016目標檢測

2016年的cvpr會議目標檢測 在這裡討論的是2d的目標檢測,如圖1所示 的方法主要是基於卷積神經網路的框架,代表性的工作有resnet 1 kaiming he等 yolo 5 joseph redmon等 ssd locnet 7 spyros gidaris等 hypernet 3 tao ...

目標檢測 YOLO v1(CVPR 2016)

yolo由24層convnet和2層fcs組成。其核心思想是將均勻劃分為多個grid cell,每個grid cell產生兩個bbox和grid cell中如果存在物件,物件是各類的概率,每個bbox由5個引數組成,xywh和confidence,confidence是bbox中存在物件的概率,將兩...