Я пытаюсь разделить большой набор данных на наборы поездов / действительных / тестовых наборов из Food101 для классификации изображений
, и структура набора данных похожа на это и содержит все изображения водна папка
'',
'Structure:',
'----------',
'pec/',
' images/',
' <class_name>/',
' <image_id>.jpg',
' meta/',
' classes.txt',
' labels.txt',
' test.json',
' test.txt',
' train.json',
' train.txt',
'',
'All images can be found in the "images" folder and are organized per class. All',
'image ids are unique and correspond to the foodspotting.com review ids.
'',
'The test/train splitting used in the experiment of our paper can be found in',
'the "meta" directory.', (edited) ```
I want to divide images dataset to train/valid/test with the list of filenames given in train.txt and test.txt, which author used
Форма поезда, действительные, тестовые списки: (101, 600), (101, 150), 25250
В colab я запускаю следующий код
for x in range(train.shape[0]):
for y in range(train.shape[1]):
temp = train[x,y] + ".jpg"
foldername = temp.split('/')[0]
!mv /content/food-101/images/$temp /content/food101/train/$foldername/
Индивидуально движущиеся изображения, выполняя вложенный цикл, принимая имена файлов в списках, тратит вечно на создание папок, так как общее количество изображений 100100, так что
У меня есть список имен файлов для train / validи тестовый набор, но как превратить их в папки, чтобы мы могли передать их в классификатор изображений в формате папок изображений Pytorch (я имею в виду, что поезд / действительный / тестовый набор - это три разные папки, и у каждой папки есть подпапки каждого класса)
Пожалуйста, скажите, если кто-нибудь знает, как это сделать, пожалуйста, и, пожалуйста, мне действительно нужна ваша помощь здесь, спасибо: smile: