pytorch讀取coco資料集

2021-09-28 16:07:01 字數 2214 閱讀 6945

yolov3: an incremental improvement:

原理在該篇部落格就寫的很詳細了,這裡就不贅述了:

#!/bin/bash

# credit:

# clone coco api

git clone

cd coco

mkdir images

cd images

# download images

wget -c

wget -c

# unzip

unzip -q train2014.zip

unzip -q val2014.zip

cd ..

# download coco metadata

wget -c

wget -c

wget -c

wget -c

tar xzf labels.tgz

unzip -q instances_train-val2014.zip

# set up image lists

paste <(awk "" <5k.part) 5k.part | tr -d '\t' > 5k.txt

paste <(awk "" trainvalno5k.txt

3.配置檔案

config.py   可以先不看這個,這個是後面需要的路徑名和一些超引數,這不是我們關注的重點,但是需要這個.

#!/usr/bin/env python

# -*- coding:utf-8 -*-

from pprint import pprint

class config:

epochs = 20

batch_size = 1

imge_folder = 'data/samples'

classes = 80

# 配置檔案位址

model_config_path = 'config/yolov3.cfg'

data_config_path = 'config/coco.data'

weight_path = 'weights/yolov3.weights'

class_path = 'data/coco.names'

# 超引數

conf_threshold = 0.8

nms_threshold = 0.4

img_size = 416

checkpoint_interval = 1

use_cuda = true

momentum = 0.9

decay = 0.0005

learning_rate = 0.001

burn_in = 1000

checkpoint_dir = 'checkpoints'

train = 'data/coco/trainvalno5k.txt'

valid = 'data/coco/5k.txt'

names = 'data/coco.names'

backup = 'backup/'

eval = 'coco'

# 判斷終端輸入是否正確

def _parse(self, kwargs):

state_dict = self._state_dict()

for k, v in kwargs.items():

if k not in state_dict:

raise valueerror('unknown option: "--%s"' % k)

setattr(self, k, v)

print('*****=user config*****===')

pprint(self._state_dict())

print('**********end**********==')

# 終端輸入替換預設配置

def _state_dict(self):

return

opt = config()

4.讀資料

在主函式中加pytorch資料載入函式

traindata = datasets(train_path)

dataloader = torch.utils.data.dataloader(

traindata, batch_size=opt.batch_size, shuffle=false)

其中資料集datasets函式為

PyTorch資料讀取

torch.utils.data.dataloader torch.utils.data.dataset,batch size,shuffle,num workers,pin memory 關鍵是這兩個類 torch.utils.data.dataloader torch.utils.data.da...

pytorch資料讀取

pytorch資料讀取機制 sampler生成索引index,根據索引從dataset中獲取和標籤 1.torch.utils.data.dataloader 功能 構建可迭代的資料裝在器 dataset dataset類,決定資料從哪讀取及如何讀取 batchsize 批大小 num works ...

Pytorch 讀取大資料集

記錄一下pytorch讀取大型資料集的要點 pytorch 讀取大資料集的一般方法 class mydataset data.dataset def init self,root filepath self.root root init 中讀取檔案路徑而非檔案本體 self.imgs list se...