COCO2014及資料集

2021-10-08 13:04:26 字數 1645 閱讀 7831

映象位址

在早期的計算機視覺社群,pascalvisualobjectclasses(voc)挑戰賽(從2023年到2012)是最重要的競賽之一。在pascalvoc中是多工的,包括影象分類,目標檢測,語義分割和行為檢測。

在目標檢測中有兩個pascal-voc版本:voc07和voc12,其中前者有5k張影象和27k個被標註目標,後者則有11k張影象和27k個被標註的目標。20類標註目標都是生活中常見:(person:person;animal:bird,cat,cow,dog,horse,sheep;vehicle:aeroplane,bicycle,boat,bus,car,motor-bike,train;indoor:bottle,chair,diningtable,pottedplant,sofa,tv/monitor。

最近幾年,隨著一些大型資料集,如ilsvrc和ms-coco被發布,voc也逐漸失去了往日的光彩,目前主要是作為新檢測器的測試地。

imagenetlargescalevisualrecognitionchallenge(ilsvrc)已經將一般的目標檢測向前推進了一大步。ilsvrc從2010到2023年每年被組織比賽,其中就包含了用imagenet影象進行檢測。ilsvrc中包含了200類視覺目標,影象和目標例項的數量比voc大兩個數量級。例如,ilsvrc-14就包含了517k張影象和534k被標註的目標

ms-coco是目前最具有挑戰性的目標檢測,從2023年開始,每年都會舉辦基於ms-coco資料集的競賽,其包含的目標種類要少於ilsvrc,但其有更多的目標例項。例如,ms-coco-17中包含了164k張影象和897k個被標註來自80個類別的目標。相比於voc和ilsvrc,ms-coco最大的進步,除了boundingbox的標註,還有單個例項分割的標註,幫助更準確的定位。另外,ms-coco包含了更多小目標(其面積小於影象的1%)和更加密集的定位目標比voc和ilsvrc。ms-coco的這些特徵讓其目標分布更接近於真實的世界。ms-coco已經在目標檢測社群變為了實際的標桿。

2023年,openimagesdetection(oid)競賽緊隨ms-coco被引進。在openimages中有兩個重要的任務:1)標準的目標檢測;2)視覺關係檢測,即檢測具有特定關係的成對目標。對於目標檢測任務,此資料集包含了1910k張影象,其中在600多個目標種類上有15440k個標註的boundingbox。

除了一般的目標檢測,在過去的20年也見證了在特定領域內檢測應用的繁榮,例如行人檢測,人臉識別,文字檢測,交通訊號檢測和遙感目標檢測。

COCO資料集概述

pk的內容包括 目標檢測與例項分割 人體關鍵點檢測 材料識別 全景分割 影象描述 目標檢測 例項分割資料標註檔案解析使用json檔案儲存 其注釋檔案中的內容就是乙個字典資料結構,包括以下5個key value對。其中info images licenses三個key是三種型別標註檔案共享的,最後的a...

COCO資料集製作

ms coco的全稱是microsoft common objects in context,源於微軟於2014年出資標註的microsoft coco資料集,其地位與imagenet等同,是衡量通用模型效能的最佳資料集之一。coco資料集是乙個大型的 豐富的物體檢測,分割和字幕資料集。以scene...

使用COCO資料集報錯

1.背景 跑深度學習的 時,用到coco資料集,就需要用到cocoapi,我們按照它的requirement來,直接把pythonapi放在相應的資料夾下,會報錯importerror no module named pycocotools.mask 或importerror no module n...