Вы можете циклически перемещаться по фрейму данных и сохранять изображения в папке, а затем использовать from_folder
заводскую функцию класса ImageDataBunch
.
Из описания данных с сайта kaggle видно, что каждая строка файла parquet
является тестовым изображением формы 137 x 236
.
image_id 0 1 2 3 4 5 6 7 8 .....
0 Test_0 247 253 253 252 252 252 252 253 253 .....
1 Test_1 253 253 253 253 253 253 253 253 253 .....
2 Test_2 253 253 253 253 253 252 251 252 252 .....
.
.
.
.
Я пробовал это, чтобы получить первое изображение.
# get the image
>>> img = df.iloc[1,1:].to_numpy().astype(int).reshape(137,236)
>>> img.shape
(137, 236)
# Image_id
>>> df.iloc[1,0]
'Test_1'
Надеюсь, это поможет!