Вот как я это делаю:
class myDataset(Dataset):
'''
a dataset for PyTorch
'''
def __init__(self, X, y):
self.X = X
self.y = y
def __getitem__(self, index):
return self.X[index], self.y[index]
def __len__(self):
return len(self.X)
, затем вы можете просто добавить в загрузчик:
full_dataset = myDataset(X,y)
train_loader = DataLoader(full_dataset, batch_size=batch_size)
Кроме того, X, y - это просто numpy массивы .
А для обучения вы можете получить доступ к своим данным с помощью цикла for:
for data, target in train_loader:
if train_on_gpu:
data, target = data.double().cuda(), target.double().cuda()