Запрос определенного типа графического процессора в Google Colab - PullRequest
1 голос
/ 19 февраля 2020

Я использую Google Colab для выполнения какого-то глубокого изучения кода.

В предыдущие дни все работало нормально, но недавно, без внесения изменений в код, я получил ошибку:

RuntimeError: CUDA call failed (correlation_forward_cuda at correlation_cuda.cc:80)

Очевидно, это ошибка, которая может появиться в зависимости от графической карты или системы, которую вы используете для запуска кода.

В Google Colab я просто перезапустил среду выполнения и попробовал Снова код На этот раз это сработало - так что я просто заподозрил, что это не повезло - в зависимости от того, дали ли вы совместимый графический процессор или нет.

Проблема в том, что теперь КАЖДЫЙ раз, когда я запускаю код, я получаю ошибку сообщение, независимо от того, сколько раз я перезапускаю среду выполнения, закрываю свой ноутбук или меняю тип среды выполнения на None, а затем снова на GPU - теперь я всегда получаю сообщение об ошибке.

Есть ли способ, который я могу запросить? конкретный c тип графического процессора? Я еще не уверен, какой тип - но была определенно одна версия, которая успешно выполняла мой код в один момент.

Мой код требует времени, чтобы даже добраться до точки сбоя, поэтому очень неприятно сохранять запускать код снова и снова, надеясь, что один раз он сработает.

1 Ответ

0 голосов
/ 14 апреля 2020

Вы не можете выбрать конкретный c графический процессор. После подключения к виртуальной машине вы можете проверить назначенный графический процессор с помощью команды:

!nvidia-smi --query-gpu=gpu_name,driver_version,memory.total --format=csv

Если данные не соответствуют вашим требованиям, вы можете завершить работу машины в меню «Управление сеансами» ( refre sh страница, если кнопка не работает). Если вам повезет, подключившись снова к другому компьютеру, вы получите нужный графический процессор, в противном случае вы можете повторить процесс до тех пор.

Я вижу, что размещенная вами ссылка связана с приложением DAIN. Я не знаю этого конкретного случая или если вы пытаетесь выполнить его, но я пробовал сеть DAIN на Colab и работал только с P1000 и P4. T4 и K80 не смогли выдать ту же ошибку, на которую вы ссылаетесь.

...