Как оптимизировать время загрузки набора данных из Google Colab? - PullRequest
0 голосов
/ 23 января 2020

Я должен использовать набор данных flicker_8k. Итак, я загрузил его на свой рабочий стол и получил доступ к нему из Google Colab с помощью следующей команды:

from google.colab import files / upload files()

Прошло почти 3 часа с момента запуска, но набор данных равен 16 % загружено только, есть ли другой способ оптимизировать время?

1 Ответ

2 голосов
/ 23 января 2020

Не уверен, загружаете ли вы архивированный файл набора данных или разархивированный. Я бы посоветовал вам загрузить заархивированный файл набора данных на свой диск Google. В зависимости от вашей скорости inte rnet, 1 ГБ не займет много времени. Когда у вас есть его, вы можете получить доступ к нему, смонтировав диск и прочитав его, используя функцию pandas dataframe pandas.read_csv('filename.zip').

Чтобы смонтировать диск, вставьте эти команды поверх файла .py.

from google.colab import drive
drive.mount('/content/gdrive')
dataset_file_name = os.path.join("/content/gdrive/My Drive", 'filename.zip')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...