自己資料集轉化為coco資料集

2021-10-05 16:17:36 字數 1826 閱讀 5805

1.將copy到對應資料夾

%cd /home/aistudio

!cp -r data/hand143_panopticdb/imgs/

* data/coco/images/

2.提取標籤資料

import json

import os

import cv2

dataset =

# 根路徑,裡面包含images(資料夾),annos.txt(bbox標註),classes.txt(類別標籤),以及annotations資料夾(如果沒有則會自動建立,用於儲存最後的json)

data_path =

'data/hand143_panopticdb/hands_v143_14817.json'

root_path =

'data/coco'

#儲存路徑

# 用於建立訓練集或驗證集v

phase =

'train'

f =open

(data_path,encoding=

'utf-8'

)content = json.load(f)

# print(content['root'][0])

for j in

range

(len

(content[

'root'])

):keypoints=

content[

'root'

][j]

['img_paths'

]= os.path.join(root_path,content[

'root'

][j]

['img_paths'])

#將路徑補全

dataset[

'images'])

for i in

range

(len

(content[

'root'

][j]

['joint_self'])

):keypoints=keypoints+content[

'root'

][j]

['joint_self'

][i]

dataset[

'annotations'])

# 建立類別標籤和數字id的對應關係

joint=

for i in

range

(len

(content[

'root'][

1]['joint_self'])

):'joint'

+str

(i))

dataset[

'categories'])

dataset[

'info'

])

3.儲存結果

# 儲存結果的資料夾

folder = os.path.join(root_path,

'annotations')if

not os.path.exists(folder)

: os.makedirs(folder)

json_name = os.path.join(root_path,

'annotations/{}.json'

.format

(phase)

)with

open

(json_name,

'w')

as f:

json.dump(dataset, f)

COCO資料集概述

pk的內容包括 目標檢測與例項分割 人體關鍵點檢測 材料識別 全景分割 影象描述 目標檢測 例項分割資料標註檔案解析使用json檔案儲存 其注釋檔案中的內容就是乙個字典資料結構,包括以下5個key value對。其中info images licenses三個key是三種型別標註檔案共享的,最後的a...

COCO資料集製作

ms coco的全稱是microsoft common objects in context,源於微軟於2014年出資標註的microsoft coco資料集,其地位與imagenet等同,是衡量通用模型效能的最佳資料集之一。coco資料集是乙個大型的 豐富的物體檢測,分割和字幕資料集。以scene...

使用COCO資料集報錯

1.背景 跑深度學習的 時,用到coco資料集,就需要用到cocoapi,我們按照它的requirement來,直接把pythonapi放在相應的資料夾下,會報錯importerror no module named pycocotools.mask 或importerror no module n...