Как запустить контейнер GPU tenorflow на Google Compute Engine? - PullRequest
0 голосов
/ 05 ноября 2019

Я пытаюсь запустить контейнер тензорного потока на вычислительных машинах Google с ускорителями GPU.

Попробовал команду

gcloud compute instances create-with-container job-name \
  --machine-type=n1-standard-4 \
  --accelerator=type=nvidia-tesla-k80 \
  --image-project=deeplearning-platform-release \
  --image-family=common-container \
  --container image gcr/io/my-container \
  --container-arg="--container-arguments=xxxx"

Но получил предупреждение

ПРЕДУПРЕЖДЕНИЕДля работы этого механизма развертывания контейнера требуется образ ОС, оптимизированный для работы с контейнерами. Выберите изображение из проекта cos-cloud (рентабельные семейства изображений cos-beta, cos-dev).

Я также пробовал системные образы из проекта cos-cloud, который, похоже, неесть драйвер CUDA, потому что в журналах тензорного потока есть предупреждение cuInit failed.

Хотите знать, как правильно запускать контейнер тензорного потока на вычислительных машинах Google с поддержкой графического процессора?

1 Ответ

1 голос
/ 05 ноября 2019

Рассматривали ли вы Облачный TPU на GKE ?

На этой странице описано, как настроить кластер GKE с графическим процессором

...