Изображение-классификация-перевод-обучение Sagemaker - PullRequest
0 голосов
/ 16 сентября 2018

Я получаю такую ​​ошибку при попытке классификации изображений с помощью Sagemaker:

ClientError: An error occurred (ValidationException) when calling the CreateTrainingJob operation: 1 validation error detected: Value 'ml.t2.medium' at 'resourceConfig.instanceType' failed to satisfy constraint: Member must satisfy enum value set: [ml.p2.xlarge, ml.m5.4xlarge, ml.m4.16xlarge, ml.p3.16xlarge, ml.m5.large, ml.p2.16xlarge, ml.c4.2xlarge, ml.c5.2xlarge, ml.c4.4xlarge, ml.c5.4xlarge, ml.c4.8xlarge, ml.c5.9xlarge, ml.c5.xlarge, ml.c4.xlarge, ml.c5.18xlarge, ml.p3.2xlarge, ml.m5.xlarge, ml.m4.10xlarge, ml.m5.12xlarge, ml.m4.xlarge, ml.m5.24xlarge, ml.m4.2xlarge, ml.p2.8xlarge, ml.m5.2xlarge, ml.p3.8xlarge, ml.m4.4xlarge]

1 Ответ

0 голосов
/ 20 сентября 2018

На данный момент тип экземпляра ml.t2.medium недоступен в SageMaker Training.

Вы можете обратиться к https://aws.amazon.com/sagemaker/pricing/, чтобы увидеть поддерживаемые типы экземпляров в используемом компоненте и регионе..

Вы также должны проверить, имеет ли выполняемый алгоритм дополнительные аппаратные ограничения.Например, алгоритм классификации изображений doc вызывает, что для обучения ему требуются экземпляры GPU:

Для классификации изображений мы поддерживаем следующие экземпляры GPU для обучения: ml.p2.xlarge, ml.p2.8xlarge, ml.p2.16xlarge, ml.p3.2xlarge, ml.p3.8xlarge and ml.p3.16xlarge.Мы рекомендуем использовать экземпляры GPU с большей памятью для тренировок с большими размерами пакетов.Однако для вывода могут использоваться экземпляры как CPU (например, C4), так и GPU (например, P2 и P3).Вы также можете запустить алгоритм на настройках с несколькими графическими процессорами и на нескольких машинах для распределенного обучения.

Оба экземпляра P2 и P3 поддерживаются в алгоритме классификации изображений.

...