pytorch之建立資料集

import torch
import torchvision
from torchvision import datasets,transforms
dataroot = "data/celeba" # 資料集所在資料夾
# 建立資料集
dataset = datasets.imagefolder(root=dataroot,
transform=transforms.compose([
transforms.resize(image_size),
transforms.centercrop(image_size),
transforms.totensor(),
transforms.normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)),
]))# create the dataloader
dataloader = torch.utils.data.dataloader(dataset, batch_size=batch_size,
shuffle=true, num_workers=workers)

1）torchvision.datasets.imagefolder(root, transform=none, target_transform=none, loader=default_loader)

它主要有四個引數：

pytorch的torchvision模組中提供了乙個dataset 包，它包含了一些基本的資料集如mnist、coco、imagenet和乙個通用的資料載入器imagefolder。不同資料夾下的圖，會被當作不同的類，天生就用於影象分類任務。

imagefolder有3個成員變數：用綠色表示x為train時的image_datasets的屬性

self.classes：用乙個list儲存類名，就是資料夾的名字。如['green', 'normal', 'out', 'right']

self.class_to_idx：類名對應的索引，可以理解為 0、1、2、3 等。如

self.imgs：儲存（imgpath，class），是和類別的陣列。如[('datasets/test_true_traintest/train/green/0000000012200roi_.jpg', 0), ... , ('datasets/test_true_traintest/train/right/0000000012980roi_.jpg', 3)]

2）torchvision.transforms

torchvision.transforms 模組提供了一般的影象轉換操作類。

把shape=(h x w x c) 的畫素值為 [0, 255] 的 pil.image 和 numpy.ndarray

轉換成shape=(c x h x w)的畫素值範圍為[0.0, 1.0]的 torch.floattensor。

3）torch.utils.data.dataloader

將資料按照batch_size封裝成tensor

pytorch之建立資料集

pytorch之資料集構造

pytorch 載入資料集

pytorch讀取coco資料集

pytorch之建立資料集

pytorch之資料集構造

pytorch 載入資料集

pytorch讀取coco資料集

相關推薦