自動化工具製作PASCAL VOC 資料集

2021-08-06 01:26:07 字數 1870 閱讀 4488

voc主要有三個重要的資料夾:annotationsimagesetsjpegimages

jpegimages 資料夾

該資料夾下存放著所有的訓練集,格式都是.jpg

需要注意的是命名格式,雖然對命名沒有特別要求,但是最好按照官方的命名方法,如000001.jpg000123.jpg,然後在這個資料夾裡就沒有其他東西了。

annotations 資料夾

以上是使用標註工具標註的人臉,(在下面會提到,自己寫的乙個比較簡陋的標註工具 ^^),該的名字是000001.jpg然後會在annotations資料夾下面生成乙個000001.xml檔案與之對應:

這是乙個基本的格式,其中的object標籤儲存的就是人臉的位置資訊,對於乙個裡面有多個物件的話,在該xml中就有多個object。然後annotations資料夾裡面就是這樣的一堆xml檔案,其他沒什麼。

imagesets 資料夾

在這個資料夾中還有乙個main資料夾,其他的資料夾不太重要(對於我目前的需求來說),這個資料夾中主要有四個.txt檔案,分別是train.txttest.txttrainval.txtval.txt

test.txt中儲存的是測試所用的所有樣本的名字,不過沒有字尾(下同),一般測試的樣本數量佔總資料集的50%

train.txt中儲存的是訓練所用的樣本名,樣本數量通常佔trainval的50%左右

val.txt中儲存的是驗證所用的樣本名,數量佔trainval的50%左右

trainval.txt中儲存的是訓練驗證樣本,是上面兩個的總和,一般數量佔總資料集的50%

根據voc的格式可以寫乙個標註工具。例如我使用python和c++製作的乙個工具:github

然後開啟vs2013工程,執行後可以開始進行的標註

標註完成後可以執行txt.py指令碼,用來生成test.txt,train.txt,val.txt,trainval.txt四個檔案並儲存在main資料夾中。

關於自動化工具

靈活的思維 obt的上線,由最初的人工替換配置檔案,到最後設計配置修改工具 使用show指定要修改的配置項 path指定這些配置項所在的檔案路徑,temp指定檔案,最後通過修改檔案流覆蓋tomcat下相應的檔案 將整個應用的配置改動都放到資料庫中,通過資料庫指令碼來執行應用配置的改動。將繁雜的上線流...

DevOps 自動化工具

devops實踐中,自動化工具的使用是非常重要的,通常涉及到下面幾個方面 讓我們看看這些方面中的一些工具,看它們是如何解決痛點的。雲服務 如aliyun,aws等 使用雲服務,不需要買硬體伺服器 租用機櫃。雲服務很容易按需擴充套件,沒有預先的硬體成本,可以根據流量自動適配。git 儲存 管理 的版本...

selenium 自動化工具

今天在使用selenium phantomjs動態抓取網頁時,出現如下報錯資訊 userwarning selenium support for phantomjs has been deprecated,please use headless versions of chrome or firef...