Получение stylegan для запуска на экземпляре gcp с v100 - PullRequest
0 голосов
/ 16 февраля 2019

Я пытался заставить stylegan работать на gcp для подключения к v100.Я смог пройти обучение для 1d, используя эту установку экземпляра

 export IMAGE_FAMILY="pytorch-latest-gpu" # or "pytorch-latest-cpu" for non-GPU instances
export ZONE="us-west2-b" # budget: "us-west1-b"
export INSTANCE_NAME="my-fastai-instance"
export INSTANCE_TYPE="n1-highmem-8" # budget: "n1-highmem-4"

# budget: 'type=nvidia-tesla-k80,count=1'
gcloud compute instances create $INSTANCE_NAME \
        --zone=$ZONE \
        --image-family=$IMAGE_FAMILY \
        --image-project=deeplearning-platform-release \
        --maintenance-policy=TERMINATE \
        --accelerator="type=nvidia-tesla-v100,count=1" \
        --machine-type=$INSTANCE_TYPE \
        --boot-disk-size=200GB \
        --metadata="install-nvidia-driver=True"

для большого набора данных, затем я запустил тот же код для другого набора данных, и, похоже, он не использует v100.Мне пришлось запустить! Pip install tenorflow-gpu оба раза

, когда я пробую код с

export IMAGE_FAMILY="tf-latest-gpu" # or "pytorch-latest-cpu" for non-GPU instances
export ZONE="us-west1-a" # budget: "us-west1-b"
export INSTANCE_NAME="my-fastai-instance"
export INSTANCE_TYPE="n1-highmem-8" # budget: "n1-highmem-4"

# budget: 'type=nvidia-tesla-k80,count=1'
gcloud compute instances create $INSTANCE_NAME \
        --zone=$ZONE \
        --image-family=$IMAGE_FAMILY \
        --image-project=deeplearning-platform-release \
        --maintenance-policy=TERMINATE \
        --accelerator="type=nvidia-tesla-v100,count=1" \
        --machine-type=$INSTANCE_TYPE \
        --boot-disk-size=200GB \
        --metadata="install-nvidia-driver=True"

Я получаю ошибки при запуске файла data_tool.py для создания записей и не могу запуститьpython3 по какой-то причине в лабораторной среде jupyter.

Также весь код работает на google colab, что заставляет задуматься, какой тип экземпляра есть у colab, и могу ли я просто найти скрипт для установки того же экземпляра сV100?

1 Ответ

0 голосов
/ 01 апреля 2019

Ваша первая команда:

export IMAGE_FAMILY="pytorch-latest-gpu" # or "pytorch-latest-cpu" for non-GPU instances
export ZONE="us-west2-b" # budget: "us-west1-b"
export INSTANCE_NAME="my-fastai-instance"
export INSTANCE_TYPE="n1-highmem-8" # budget: "n1-highmem-4"

# budget: 'type=nvidia-tesla-k80,count=1'
gcloud compute instances create $INSTANCE_NAME \
        --zone=$ZONE \
        --image-family=$IMAGE_FAMILY \
        --image-project=deeplearning-platform-release \
        --maintenance-policy=TERMINATE \
        --accelerator="type=nvidia-tesla-v100,count=1" \
        --machine-type=$INSTANCE_TYPE \
        --boot-disk-size=200GB \
        --metadata="install-nvidia-driver=True"

использует семейство изображений pytorch-latest-gpu для этого изображения НЕ установлен предустановленный TensorFlow и его не следует использовать с задачами TensorFlow.

как для второйкоманда использует tf-latest-gpu семейство, которое является правильным.Могу ли я попросить предоставить нам более подробную информацию, чтобы помочь:

  • Какой код вы пытаетесь запустить?
  • Можете ли вы скопировать и вставить ошибку здесь?
  • если он работает на Colab, может быть, у вас есть ссылка на общедоступную записную книжку Colab?

Кстати, Colab использует 1 графический процессор K80.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...