MS COCO資料集標註格式解析

2021-08-21 21:36:26 字數 1406 閱讀 6146

coco是微軟提供的乙個影象識別的資料集。其中包括3個tasks,分別是object instances, object keypoints, 和image captions,儲存格式為json。

基本的資料結構定義如下:

info

image

license

其中images和licenses是包含多個例項的陣列。

三個tasks的格式相近,這裡以一段object keypoints的例項**為例進行解析。

"info":,

"image":,

"licenses":,

"annotations":,

"category":

先看annotation欄位。segmentation格式取決於這個例項是乙個單個的物件(即iscrowd=0,將使用polygons格式)還是一組物件(即iscrowd=1,將使用rle格式)。單個的物件(iscrowd=0)可能需要多個polygon來表示,比如這個物件在影象中被擋住了。而iscrowd=1時(將標註一組物件,比如一群人)的segmentation使用的就是rle格式。而只要是iscrowd=0那麼segmentation就是polygon格式;只要iscrowd=1那麼segmentation就是rle格式。另外,每個物件(不管是iscrowd=0還是iscrowd=1)都會有乙個矩形框bbox ,矩形框左上角的座標和矩形框的長寬會以陣列的形式提供,陣列第乙個元素就是左上角的橫座標值。area是area of encoded masks,是標註區域的面積。如果是矩形框,那就是高乘寬;如果是polygon或者rle,那就複雜點。

keypoints是乙個長度為3*k的陣列,其中k是category中keypoints的總數量。每乙個keypoint是乙個長度為3的陣列,第一和第二個元素分別是x和y座標值,第三個元素是個標誌位v,v為0時表示這個關鍵點沒有標註(這種情況下x=y=v=0),v為1時表示這個關鍵點標註了但是不可見(被遮擋了),v為2時表示這個關鍵點標註了同時也可見。num_keypoints表示這個目標上被標註的關鍵點的數量(v>0),比較小的目標上可能就無法標註關鍵點。

再看category欄位,儲存的是當前物件所屬的category的id,以及所屬的supercategory的name(在object keypoint任務中只有一類,即person)。keypoints是乙個長度為k的陣列,包含了每個關鍵點的名字;skeleton定義了各個關鍵點之間的連線性(比如人的左手腕和左肘就是連線的,但是左手腕和右手腕就不是)。

注:人體關鍵點檢測任務,coco中有18個關鍵點,而mpi有15個。coco關鍵點順序如下:

標註資料解析 xml格式的標註資料解析

xml基本構成 1.標籤 標籤名 ps 起始標籤和結束標籤是成對存在的。且結束標籤多了個 起始標籤 成份訪問 結合 說明 1.構建樹和跟節點 2.獲取子節點 ps 直客獲取名稱相同的直接子節點 find 節點名稱 獲取同名直接子節點 缺點 只能根據提供的名稱獲取第乙個子節點 findall 節點名稱...

資料集標註

入坑機器學習,首先要確定整體框架,而框架的構成就是對比演算法 資料集和指標。資料集是驗證演算法的關鍵,而在 中萬一沒有現成的 標註資料集的軟體很多,labelme,labelimg可生成json和xml的標註檔案,以下為安裝方法 labelme安裝,若pyqt5安裝顯示沒有對應版本,可以在anaco...

R語言資料集標註

目的 為了使結果更易解讀,資料分析人員通常會對資料集進行標註 形式 通常這種標註包括為變數名新增描述性標籤以及為類別型變數中新增值標籤 標籤型別 1 變數標籤 方法是將變數標籤作為變數名,然後通過 位置下標來訪問這個變數 2 值標籤 factor 可為類別型變數建立值標籤 例子 patientdat...