Если превышено MaxRuntimeInSeconds
, то загрузка модели выполняется только наилучшим образом и действительно зависит от того, сохранил ли алгоритм какое-либо состояние до /opt/ml/model
до его завершения.
Двухминутный период ожидания между С 15:33 до 15:35 на этапе Stopping
означает максимальное время между SIGTERM
и SIGKILL
сигналом, отправляемым в ваш алгоритм (см. SageMaker do c для получения более подробной информации ). Если ваш алгоритм перехватывает SIGTERM, он должен использовать его в качестве сигнала для изящного сохранения своей работы и завершения работы до того, как платформа SageMaker принудительно убьет его с помощью сигнала SIGKILL через 2 минуты.
Учитывая, что период ожидания в Stopping
шаг - ровно 2 минуты, а также тот факт, что Uploading
шаг начался в 15:35 и завершился почти сразу же в 15:35. Вероятно, ваш al go не воспользовался предупреждением SIGTERM и что ничего не сохранено в /opt/ml/model
. Чтобы дать вам четкий ответ относительно того, действительно ли это так, создайте сообщение на форуме SageMaker , и команда SageMaker может отправить вам личное сообщение, чтобы собрать подробности о вашей работе.