Тайм-аут развертывания при развертывании модели машинного обучения в экземпляре контейнера Azure с конвейером azure - PullRequest
0 голосов
/ 07 августа 2020

Наш код работал нормально до вчерашнего дня при развертывании модели машинного обучения на Azure ACI, но столкнулся с тайм-аутом развертывания или иногда 400 (плохой ответ) сегодня.

Есть ли какие-либо проблемы с центрами обработки данных Microsoft или там что-то еще?

Ошибки приведены ниже

"message": "Получен неверный ответ от службы управления моделями: \ nКод ответа: 400 \ nЗаголовки: {'Дата': 'Thu, 06 Aug 2020 21:05:31 GMT', 'Content-Type': 'application / json', 'Transfer-Encoding': 'chunked', 'Connection': 'keep-alive', 'Запрос -Context ':' appId = cid-v1: 2d2e8e63-272e-4b3 c -8598-4ee570a0e70d ',' x-ms-client-request-id ':' 8aa4dcafb0ec40ef822b55fc4c7a196f ',' x-ms-client-session id ':' bf2decff-8879-4a9 c -bb5f-2fae7034946 c ',' api-supported-versions ':' 1.0, 2018-03-01-preview, 2018-11-19 ',' x- request-time ':' 0.044 ',' Strict-Transport-Security ':' max-age = 15724800; includeSubDomains; preload '} \ nContent: b' {"code": "BadRequest", "statusCode": 400, " сообщение ":" Запрос недопустим. "," подробности ": [{" код ":" InvalidOverwriteRequest "," сообщение ":" Недействительный запрос перезаписи - невозможно обновить требования к ресурсам контейнера, метку имени DNS или тип развертывания. Удалите и повторно разверните эту службу. "}]," Correlation ": {" RequestId ":" 8aa4dcafb0ec40ef822b55fc4c7a196f "}} '"

"message": "Достигнут опрос при развертывании службы. успешное состояние терминала, текущее состояние службы: Неработоспособный \ nИдентификатор операции: 1b6746b3-cdb6-4e0 c -a43d-b31b34ac99b2 \ nБолее подробную информацию можно найти с помощью '.get_logs ()' \ nОшибка: \ n {\ n "код": "DeploymentTimedOut", \ n "statusCode": 504, \ n "message": "Опрос операции развертывания имеет TimedOut. Создание службы занимает больше времени, чем обычно. Мы все еще пытаемся достичь желаемого состояния веб-службы. Пожалуйста, проверьте состояние веб-службы на предмет текущего состояния веб-службы. Вы можете запустить print (service.state) из python SDK, чтобы получить текущее состояние веб-службы. "\ N}"

1 Ответ

0 голосов
/ 10 августа 2020

Согласно сообщению об ошибке InvalidOverwriteRequest-cannot update..., у вас уже было существующее развертывание с таким же именем до запуска конвейера.

Используете ли вы задачу Azure ML Model Deploy task from Machine Learning ? Если да, вам необходимо включить параметр OverWrite existing deployment для задачи развертывания.

введите описание изображения здесь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...