PascalVOC2012目標檢測資料集中的問題

2021-09-22 13:59:42 字數 952 閱讀 9192

pascalvoc2012的目標檢測資料集一共有20類,每一類目標的具體情況如下:

person:17401個

aeroplane:1002個

tvmonitor:893個

train:704個

boat:1059個

dog:1598個

chair:3056個

bird:1271個

bicycle:837個

bottle:1561個

sheep:1084個

diningtable:800個

horse:803個

motorbike:801個

sofa:841個

cow:771個

car:2492個

cat:1277個

bus:685個

pottedplant:1202個

其中,person這一類的目標框數量其實不止17401個,而是20474個,上面統計的是label,但是實際上,voc格式的資料集是容許乙個標籤有多個框的。如下所示,就是說這個公共資料集可能由於很多人一起標註,所以對同乙個目標會標出大小不一樣的框。而其他類就沒有這個問題。所以其實要跑的話,這些框可能需要處理一下。如果我跑的話會可能寫個**把這些part刪除掉。

遮擋、標註不準確、目標過小、陰影等,這些常見的問題都有,如下圖。

pascal voc2012資料集介紹

一 原始pascal voc2012 資料集 該資料集包括20個物件類 10個動作類 具體內容 annotations 17125個物件,xml格式的標籤 imagesets 包括action layout main segmentation四個部分的內容,是資料集中每一種型別的資訊。其中actio...

解決目標檢測中的難分樣本(漏檢測與誤檢測問題)

asdn網路使用roi池層提取的功能作為輸入影象補丁。asdn網路比 遮擋 退出掩碼,然後將其用於丟棄特徵值並傳遞到fast rcnn的分類塔。對抗空間丟棄網路 asdn 它學習如何封閉給定的目標,使得frcn難以對其進行分類。我們在本文中考慮的第二種型別的生成是變形。在這種情況下,我們提出了對抗空...

目標檢測的資料集格式轉換

在yolov3目標識別任務中,有乙個必不可少的步驟,就是標籤的格式轉換,例如用imagelabel標註了目標框,但是得到的標籤格式為xml,如果想將他轉換為txt格式如何處理?轉換成 000001.jpg 366,29,441,164 red上述是乙個例子,假設資料夾a下有若干個xml檔案,需要轉換...