В pytorch DataLoader разделяет набор данных на пакеты заданного размера с дополнительными опциями перестановки и т. Д., Которые затем можно зациклить.
Но если мне нужно увеличить размер пакета, например, первые 10партия размера 50, следующие 5 партий размера 100 и т. д., как лучше всего это сделать?
Я попытался разбить тензор, затем объединить их:
#10x50 + 5*100
originalTensor = torch.randn(1000, 80)
split1=torch.split(originalTensor, 500, dim=0)
split2=torch.split(list(split1)[0], 100, dim=0)
После этого естьспособ передать составной тензор в dataLoader или любой другой способ напрямую превратить объединенный тензор в генератор (который может потерять тасование и другие функции)?