COCO資料集解讀

2021-09-13 00:15:37 字數 1689 閱讀 7117

cver必然要對microsoft coco資料集有一定的了解,今天就對coco做一點解讀。

關於coco的介紹應該能看懂,這裡我們只強調一下重要資訊。

看一下標註檔案,不同的檔案對應不同的task,比如instances_train2017.json是檢測與分割任務的訓練集標註。

再關注一下檔案細節,其中標註資訊儲存在annotations欄位,具體的儲存的資訊表示什麼參見官網或者相關**。

為使使用者更好地使用coco資料集,coco提供了各種api(其實就是提取標註檔案中的資訊),現就pythonapi的使用最一些簡單介紹。

cocoapi來自於github ,從github上clone即可。

git clone
# 在anaconda相應的虛擬環境中安裝

# 安裝完成後在pycharm中呼叫該虛擬環境直譯器時,

# pycharm左邊面板外部庫會多出來pycocotools庫

使用影象檢測與分割資料集

使用人體關節點檢測資料集

使用語義分析資料集

完整原始碼參見:

現就幾個函式做一些說明:

getcatids(catnms=, supnms=, catids=):通過輸入類別的名字、大類的名字或是種類的id,來篩選得到所屬類別的id。

getimgids(imgids=, catids=):通過的id或所屬種類的id得到的id。

loadimgs(ids=):得到的id資訊後,就可以用loadimgs得到的資訊了 。

getannids(imgids=, catids=, arearng=, iscrowd=none):通過輸入的id、類別的id、例項的面積、是否是人群來得到的注釋id。再根據注釋資訊進行例項分割。

loadanns(ids=):通過注釋的id,得到注釋的資訊。

showanns(anns):使用標註的資訊畫分割的結果。

COCO資料集解析 津南數字製造演算法挑戰賽

object instance 型別的標註格式 1,整體json檔案格式 比如上圖中的instances train2017.json instances val2017.json這兩個檔案就是這種格式。object instance這種格式的檔案從頭至尾按照順序分為以下段落 是的,你開啟這兩個檔案...

COCO資料集的 標籤檔案 json解讀 理解

json 檔案的本質是乙個字典 import json filedir instances val2014.json annos json.loads open filedir read print type annos print len annos 5 print annos.keys 鍵pri...

SCIERC資料集解析

官方資料集位址 multi task identification of entities,relations,and coreference for scientific knowledge graph construction 七種關係型別 一條資料集包含 clusters 共指集群 6 11 ...