目標檢測的資料集格式轉換

2021-10-10 10:43:10 字數 1566 閱讀 1236

在yolov3目標識別任務中,有乙個必不可少的步驟,就是標籤的格式轉換,例如用imagelabel標註了目標框,但是得到的標籤格式為xml,如果想將他轉換為txt格式如何處理?

轉換成 

000001.jpg 366,29,441,164 red
上述是乙個例子, 假設資料夾a下有若干個xml檔案,

需要轉換成若干行如下的txt檔案,例如,

可參考我寫的**。

import  os

import xml.etree.elementtree as et

path=r"g:\lacoo_dataset\detector\train_ann"

class_list=["red","yellow","green","right","stop"]

def xml_text_sigle(path,str_):

tree = et.parse(path)

root=tree.getroot()

for child in root:

if child.tag=="filename":

str_+=child.text

str_+=" "

if child.tag=="object":

for chileren in child:

if chileren.tag=="bndbox":

for i in range(4):

str_+=chileren[i].text

if i<3:

str_+=","

if chileren.tag=="name":

str_+=str(class_list.index(chileren.text))

str_+=" "

str_list = str_.split(" ")

str_list.remove(str_list[1])

str_ = " ".join(str_list)

return str_

def xml_test(path):

t = open("t.txt", "w")

for i in os.listdir(path):

t.writelines(xml_text_sigle(os.path.join(path,i),"")+"\n")

xml_test(path)

這裡將標籤用數字代替,得到的txt格式為

目標檢測之常用資料集

我們在利用模型檢測實際應用問題的時候,通常需要使用自己標註和收集資料集來進行訓練。但對於不同演算法效能的比較,我們常常需要一些基本的資料集來進行橫向對比。下列是一些常用的目標檢測資料集 pascal voc挑戰在2005年至2012年間展開。pascal voc 2007 9963張影象,24640...

目標檢測經典資料集 深度學習

資料集 pascal voc,imagenet,ms coco等資料集。注 由於類別僅20個,因此被看成目標檢測方向的乙個基準資料集 imagenet資料集 是乙個計算機視覺系統識別專案,是目前世界上影象識別最大的資料庫,是美國斯坦福的計算機科學家,模擬人類的識別系統建立的。imagenet資料集是...

PascalVOC2012目標檢測資料集中的問題

pascalvoc2012的目標檢測資料集一共有20類,每一類目標的具體情況如下 person 17401個 aeroplane 1002個 tvmonitor 893個 train 704個 boat 1059個 dog 1598個 chair 3056個 bird 1271個 bicycle 8...