Как получить доступ к файлам, загруженным из kaggle, в записную книжку Colab Laboratory? - PullRequest
0 голосов
/ 03 октября 2019

У меня возникли некоторые трудности с манипулированием несколькими файлами в записной книжке Колаборатории, загруженной в каталог / content на моем диске Google. До сих пор я успешно загрузил и извлек набор данных kaggle в записную книжку Колаборатории, используя следующий код:

!kaggle datasets download -d iarunava/cell-images-for-detecting-malaria -p /content
!unzip \cell-images-for-detecting-malaria.zip

Я также смог использовать подушку для импорта одного файла из набора данных в мою сессию Колаборатории (Я получил имя файла из выходных данных, полученных во время извлечения):

from PIL import Image
img = Image.open('cell_images/Uninfected/C96P57ThinF_IMG_20150824_105445_cell_139.png')

Как получить доступ к нескольким извлеченным файлам из / content, не зная заранее их имен?

Спасибо!

Ответы [ 2 ]

1 голос
/ 03 октября 2019

После дальнейших экспериментов я обнаружил, что модуль python os работает в Colab Notebooks так же, как и на отдельном компьютере. Например, в записной книжке Colab команда

os.getcwd()

возвращает вывод '/ content'.

Кроме того, команда os.listdir() возвращает имена всех загруженных файлов иизвлечены.

0 голосов
/ 07 октября 2019

Вы можете использовать glob . glob.glob(pattern) будет соответствовать всем файлам, которые соответствуют шаблону. Например, код ниже будет читать все .png файлы в image_dir.

png = glob.glob(os.path.join(img_dir, '*.png'))
png = np.array(png)

png будет содержать список имен файлов.

В вашем случае вы можете использовать:

png = glob.glob('cell_images/Uninfected/*.png')
png = np.array(png)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...