Как загрузить данные изображения из файла паркета и метки из файла CSV в Fastai - PullRequest
0 голосов
/ 22 декабря 2019

Я пытаюсь использовать библиотеку fastai в https://www.kaggle.com/c/bengaliai-cv19, но не могу найти документацию по загрузке изображения из файла паркета.

Я преобразовал файл паркета в dataFrame и ImageDataBunch требуется аргумент путь , но изображение уже находится в dataFrame, как мне загрузить его в ImageDataBunch.

1 Ответ

1 голос
/ 22 декабря 2019

Вы можете циклически перемещаться по фрейму данных и сохранять изображения в папке, а затем использовать from_folder заводскую функцию класса ImageDataBunch.

Из описания данных с сайта kaggle видно, что каждая строка файла parquet является тестовым изображением формы 137 x 236.

  image_id    0    1    2    3    4    5    6    7    8  .....
0   Test_0  247  253  253  252  252  252  252  253  253  .....
1   Test_1  253  253  253  253  253  253  253  253  253  .....
2   Test_2  253  253  253  253  253  252  251  252  252  .....
.
.
.
.

Я пробовал это, чтобы получить первое изображение.

# get the image
>>> img = df.iloc[1,1:].to_numpy().astype(int).reshape(137,236)
>>> img.shape
(137, 236)

# Image_id
>>> df.iloc[1,0]
'Test_1'

Надеюсь, это поможет!

...