Учебное пособие, похоже, не объясняет, как мы должны загружать, разбивать и делать правильное увеличение.
Давайте получим набор данных, состоящий из автомобилей и кошек.Структура папок будет такой:
data
cat
0101.jpg
0201.jpg
...
dogs
0101.jpg
0201.jpg
...
Сначала я загрузил набор данных с помощью наборов данных. Функция ImageFolder.Функция Image имеет команду «TRANSFORM», где мы можем установить некоторые команды дополнения, но мы не хотим применять дополнения к тестовому набору данных!Итак, давайте останемся с transform = None.
data = datasets.ImageFolder(root='data')
По-видимому, у нас нет обучения и тестирования структуры папок, и поэтому я предполагаю, что хорошим подходом было бы использование функции split_dataset
train_size = int(split * len(data))
test_size = len(data) - train_size
train_dataset, test_dataset = torch.utils.data.random_split(data, [train_size, test_size])
Сейчасдавайте загрузим данные следующим образом.
train_loader = torch.utils.data.DataLoader(train_dataset,
batch_size=8,
shuffle=True)
test_loader = torch.utils.data.DataLoader(test_dataset,
batch_size=8,
shuffle=True)
Как применить преобразования (увеличение данных) к изображениям "train_loader"?
В основном мне нужно: 1. загрузить данные из структуры папок, описанной выше 2. разбить данные на части для испытаний / обучения 3. применить аугментации для части поезда.