ОШИБКА: (gcloud.compute.instances.create) Не удалось получить ресурс: - Превышена квота 'GPUS_ALL_REGIONS'. Лимит: 0,0 глобально - PullRequest
1 голос
/ 16 июня 2020

Я хотел бы попробовать PEGASUS, чтобы подытожить статью. https://github.com/google-research/pegasus

Я выполнил эту инструкцию. https://github.com/google-research/pegasus/tree/f76b63c2886748f7f5c6c9fb547456d8c6002562#setup

Я проверил регион, который я могу использовать NVIDIA Tesla V100, и решил использовать us-central1-a https://cloud.google.com/compute/docs/gpus

I использовал эту команду.

gcloud compute instances create pegasustest --zone=us-central1-a 
--machine-type=n1-highmem-8 --accelerator type=nvidia-tesla-v100,count=1 
--boot-disk-size=500GB --image-project=ml-images --image-family=tf-1-15 
--maintenance-policy TERMINATE --restart-on-failure

Я получил это сообщение об ошибке.

ERROR: (gcloud.compute.instances.create) Could not fetch resource:
 - The zone 'projects/covid19agent/zones/us-central1-a' does not have enough 
resources available to fulfill the request.  
Try a different zone, or try again later.

Я потратил 3 часа и попытался снова, но получил тот же результат.

Итак , Я изменил регион с us-central1-a на asia-east1-c.

Я использовал эту команду.

gcloud compute instances create pegasustest --zone=asia-east1-c 
--machine-type=n1-highmem-8 --accelerator type=nvidia-tesla-v100,count=1 
--boot-disk-size=500GB --image-project=ml-images --image-family=tf-1-15 
--maintenance-policy TERMINATE --restart-on-failure

Затем я получил это сообщение об ошибке.

WARNING: Some requests generated warnings:
 - Disk size: '500 GB' is larger than image size: '10 GB'. 
You might need to resize the root repartition manually 
if the operating system does not support automatic resizing. 
See https://cloud.google.com/compute/docs/disks/add-persistent-disk#resize_pd 
for details.

ERROR: (gcloud.compute.instances.create) Could not fetch resource:
 - Quota 'GPUS_ALL_REGIONS' exceeded.  Limit: 0.0 globally.

Я не могу попробовать ПЕГАС? И не слишком ли дорого стоит попробовать PEGASUS?

1 Ответ

1 голос
/ 17 июня 2020

Начнем с первого номера . Посмотрите еще раз на сообщение об ошибке:

ОШИБКА: (gcloud.compute.instances.create) Не удалось получить ресурс: - Зона 'projects / covid19agent / zone / us-central1-a' недостаточно ресурсов для выполнения запроса. Попробуйте использовать другую зону или повторите попытку позже.

Когда вы запускаете экземпляр он запрашивает такие ресурсы, как виртуальный ЦП, память, графический процессор, и если в зоне, которую вы используете, недостаточно ресурсов будет такое сообщение, дополнительная информация доступна в документации :

Если вы получаете сообщение об ошибке ресурса (например, ZONE_RESOURCE_POOL_EXHAUSTED или ZONE_RESOURCE_POOL_EXHAUSTED_WITH_DETAILS) при запросе новых ресурсов, это означает, что зона в настоящее время не может удовлетворить ваш запрос. Эта ошибка возникает из-за доступности ресурсов Compute Engine, а не из-за вашей квоты Compute Engine.

Доступность ресурсов зависит от запросов пользователей и поэтому является динамической c.

Есть несколько способов решить эту проблему :

  1. Подождите немного и попробуйте снова запустить свой экземпляр виртуальной машины (как вы пытались, но безрезультатно на этот раз).
  2. Переместите свой экземпляр в другую зону (как и вы).
  3. Зарезервируйте ресурсы для вашей виртуальной машины, выполнив следующие действия. документация, чтобы избежать такой проблемы в будущем:

    Создание резервирования для экземпляров виртуальных машин (ВМ) в определенной зоне, используя настраиваемые или предопределенные типы машин, с дополнительными графическими процессорами или локальными твердотельными накопителями или без них, для обеспечения ресурсов доступны для ваших рабочих нагрузок, когда они вам нужны. После создания резервирования вы сразу же начинаете оплачивать зарезервированные ресурсы, и они остаются доступными для вашего проекта на неопределенный срок, пока резервирование не будет удалено.

Теперь давайте посмотрим на вторую проблему . Посмотрите еще раз на это сообщение об ошибке:

ОШИБКА: (gcloud.compute.instances.create) Не удалось получить ресурс: - Превышена квота «GPUS_ALL_REGIONS». Предел: 0,0 глобально.

Дополнительную информацию о квотах можно найти в документации .

Чтобы решить эту проблему, выполните следующие действия: :

  1. Убедитесь, что для вашего проекта включен биллинг.
  2. Запрос на увеличение квоты :

    1. Go на страницу Квоты .
    2. На странице Квоты выберите квоты, которые вы хотите изменить.
    3. Нажмите кнопку «Изменить квоты» в верхней части страницы.
    4. Установите флажок для службы, которую вы хотите изменить.
    5. Заполните имя, адрес электронной почты и номер телефона и нажмите кнопку Далее.
    6. Введите свой запрос на увеличение квоты и нажмите Далее.
    7. Отправьте запрос.
    8. Запрос на уменьшение квота отклонена по умолчанию. Если вам необходимо уменьшить квоту, ответьте на электронное письмо службы поддержки, объяснив свои требования. Представитель службы поддержки из команды Compute Engine ответит на ваш запрос в течение 24–48 часов.

    Вы не можете запросить увеличение квоты, если используете 12-месячный, 300 долларов США. Бесплатная пробная версия из-за ограничений:

    Ваш бесплатный пробный кредит распространяется на все ресурсы Google Cloud, за следующими исключениями:

    • У вас не может быть более 8 ядер (или виртуальных ЦП), работающих одновременно.
    • Вы не можете добавлять графические процессоры к своим экземплярам ВМ.
    • Вы не можете запросить увеличение квоты. Обзор квот Compute Engine см. В разделе Квоты ресурсов .
    • Вы не можете создавать экземпляры виртуальных машин на основе образов Windows Server .

    Вы должны обновить свою учетную запись , чтобы выполнить любое из действий в предыдущем списке.

Вы можете оценить стоимость использования с помощью Google Cloud Pricing Calculator .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...