COCO2014及資料集

映象位址

在早期的計算機視覺社群，pascalvisualobjectclasses（voc）挑戰賽（從2023年到2012）是最重要的競賽之一。在pascalvoc中是多工的，包括影象分類，目標檢測，語義分割和行為檢測。

在目標檢測中有兩個pascal-voc版本：voc07和voc12，其中前者有5k張影象和27k個被標註目標，後者則有11k張影象和27k個被標註的目標。20類標註目標都是生活中常見：(person:person;animal:bird,cat,cow,dog,horse,sheep;vehicle:aeroplane,bicycle,boat,bus,car,motor-bike,train;indoor:bottle,chair,diningtable,pottedplant,sofa,tv/monitor。

最近幾年，隨著一些大型資料集，如ilsvrc和ms-coco被發布，voc也逐漸失去了往日的光彩，目前主要是作為新檢測器的測試地。

imagenetlargescalevisualrecognitionchallenge(ilsvrc)已經將一般的目標檢測向前推進了一大步。ilsvrc從2010到2023年每年被組織比賽，其中就包含了用imagenet影象進行檢測。ilsvrc中包含了200類視覺目標，影象和目標例項的數量比voc大兩個數量級。例如，ilsvrc-14就包含了517k張影象和534k被標註的目標

ms-coco是目前最具有挑戰性的目標檢測，從2023年開始，每年都會舉辦基於ms-coco資料集的競賽，其包含的目標種類要少於ilsvrc，但其有更多的目標例項。例如，ms-coco-17中包含了164k張影象和897k個被標註來自80個類別的目標。相比於voc和ilsvrc，ms-coco最大的進步，除了boundingbox的標註，還有單個例項分割的標註，幫助更準確的定位。另外，ms-coco包含了更多小目標（其面積小於影象的1%）和更加密集的定位目標比voc和ilsvrc。ms-coco的這些特徵讓其目標分布更接近於真實的世界。ms-coco已經在目標檢測社群變為了實際的標桿。

2023年，openimagesdetection(oid)競賽緊隨ms-coco被引進。在openimages中有兩個重要的任務：1）標準的目標檢測；2）視覺關係檢測，即檢測具有特定關係的成對目標。對於目標檢測任務，此資料集包含了1910k張影象，其中在600多個目標種類上有15440k個標註的boundingbox。

除了一般的目標檢測，在過去的20年也見證了在特定領域內檢測應用的繁榮，例如行人檢測，人臉識別，文字檢測，交通訊號檢測和遙感目標檢測。

COCO2014及資料集

COCO資料集概述

COCO資料集製作

使用COCO資料集報錯

COCO2014及資料集

COCO資料集概述

COCO資料集製作

使用COCO資料集報錯

相關推薦