Я искал решение, позволяющее решить проблему медленной скорости загрузки набора данных изображений в Google Colab, когда я использую соединение с GoogleDrive. Используя следующий код:
from google.colab import drive
drive.mount('/content/gdrive')
Используя эту процедуру, я могу загружать изображения и создавать ярлыки, используя my def load_dataset
:
'train_path=content/gdrive/MyDrive/Capstone/Enviroment/cell_images/train'
train_files, train_targets = load_dataset(train_path)
Но, как я уже сказал, это очень медленно, особенно потому, что мой полный набор данных состоит из 27560 изображений.
Чтобы решить мою проблему, я попытался использовать это решение .
Но теперь, чтобы по-прежнему использовать мою функцию def
, после загрузки файла .tar
я хочу извлечь его в определенную папку в среде colab. Я нашел этот ответ , но не решил мою проблему.
Пример: * * тысяча двадцать-пять
Это среда с уже загруженным test.tar.
Но я хочу извлечь файлы из tar-файла, структура которого train/Uninfected
; train/Parasitized
, чтобы получить это:
содержание
- cell_images
- тест
- паразитирует
- неинфицированных
- поезд
- паразитирует
- неинфицированных
- Действительны
- паразитирует
- неинфицированных
Чтобы использовать путь в функции def:
train_path = train_path=content/cell_images/train/'
train_files, train_targets = load_dataset(train_path)
test_path = train_path=content/cell_images/test/'
test_files, test_targets = load_dataset(test_path)
valid_path = train_path=content/cell_images/valid/'
valid_files, valid_targets = load_dataset(valid_path)
Я пытался использовать:
! mkdir -p content/cell_images
а также
!tar -xvf 'test.tar' content/cell_images
Но это не работает.
Кто-нибудь знает, как действовать?
Спасибо!