pytorch dataloader使用教程

2021-10-21 22:51:07 字數 1053 閱讀 2606

dataloader是pytorch之中可以靈活地取出數值的乙個相應類,首先需要將自己使用的資料用dataset封裝起來,然後打包成為dataloader變數進行操作

import torch

from torch.utils.data import dataset, dataloader

x = torch.randn(

128,3)

y = torch.randn(

128,1)

# 1. 用dataset封裝資料集,僅做示範,實際可直接用tensordataset封裝

class

mydataset

(dataset)

:def

__init__

(self, x, y)

:assert x.size(0)

==y.size(0)

self.x, self.y = x, y

#定義初始化變數

def__getitem__

(self, idx)

:return

(self.x[idx]

, self.y[idx]

)#定義每次取出的對應數值

def__len__

(self)

:return self.x.size(0)

#定義tensor的總長度

# 2. 用dataloader定義資料批量迭代器

dataset = mydataset(x,y)

mydataloader = dataloader(dataset=dataset,shuffle=

true

,batch_size=4)

for data_iter1,data_iter2 in mydataloader:

print

('data_iter1 = '

)print

(data_iter1)

print

('data_iter2 = '

)print

(data_iter2)

pytorch DataLoader模組的使用

當訓練集特別大的時候 數萬條起步 每一輪訓練僅僅希望從中隨機取出一部分資料 比如batch size 64 計算模型損失值 執行梯度下降,這就是sgd隨機梯度下降。下面是乙個demo,其實訓練集一共只有四條資料。encoding utf 8 import torch import torch.nn ...

pytorch DataLoader 自定義資料集

pytorch 提供了一種資料處理的方式,能夠生成mini batch的資料,在訓練和測試的時候進行多執行緒處理,加快準備資料的速度。這個函式工具是 torch.utils.data import dataset,dataloader 其中dataset是我們定義自己的多執行緒資料處理框架的父類,我...

koa generic session 使用教程

本系列是我的常用 koa 中介軟體使用筆記,防止忘記使用方法而作記錄 koa generic session 需要使用 koa redis作為儲存入口,需要安裝並引用。const koa require koa const session require koa generic session co...