Облачный ресурс Google исчерпан, недостаточно ускорителей - PullRequest
0 голосов
/ 20 октября 2018

Я пытаюсь запустить обучение ML на gcloud, но продолжаю получать эту ошибку

ERROR: (gcloud.ml-engine.jobs.submit.training) RESOURCE_EXHAUSTED: Field: scale_tier Error: Insufficient accelerators are available in region US-EAST4 to schedule the job which requests 1 K80 accelerators. Please wait and try again or else try submitting your job to a different region.
    - '@type': type.googleapis.com/google.rpc.BadRequest
      fieldViolations:
      - description: Insufficient accelerators are available in region US-EAST4 to schedule
          the job which requests 1 K80 accelerators. Please wait and try again or else
          try submitting your job to a different region.
        field: scale_tier

После ожидания и переключения областей / зон результат остается тем же.Движение действительно такое высокое везде, или я делаю что-то не так?Существует ли какой-либо инструмент мониторинга / доступных ресурсов для проверки свободных слотов?

1 Ответ

0 голосов
/ 21 октября 2018

US-EAST4 не имеет ускорителей K80.Вот таблица, в которой перечислены ускорители и в каких регионах они доступны:

https://cloud.google.com/compute/docs/gpus/

Я бы предложил попробовать US-EAST1.Вы также можете попробовать US-CENTRAL.

Я воспользуюсь нашим внутренним средством отслеживания проблем, чтобы исследовать возможность улучшения сообщения об ошибке в этом случае: существует разница между запросом ускорителя в регионе, который не имеетте против региона, в котором они есть, но все они используются.

...