Я создал модель XGBoost с AWS SageMaker.Сейчас я пытаюсь использовать его в пакетном задании преобразования, и все это довольно хорошо подходит для небольших пакетов.
Однако в файле размером ~ 16 МБ есть несколько больший пакет из 600 000 строк, и я не могу управлятьзапустить его за один раз.Я попробовал две вещи:
1.
Установка максимального размера полезной нагрузки задания преобразования на максимум (100 МБ):
transformer = sagemaker.transformer.Transformer(
model_name = config.model_name,
instance_count = config.inference_instance_count,
instance_type = config.inference_instance_type,
output_path = "s3://{}/{}".format(config.bucket, config.s3_inference_output_folder),
sagemaker_session = sagemaker_session,
base_transform_job_name = config.inference_job_prefix,
max_payload = 100
)
Однако я все ещеполучить сообщение об ошибке (через консольные журналы CloudWatch):
413 Request Entity Too Large
The data value transmitted exceeds the capacity limit.
2.
Установка для max_payload значения 0, которое, по спецификации, Amazon SageMaker должно интерпретировать как отсутствие ограничения размера полезной нагрузки.
В этом случае задание успешно завершается, но выходной файл пуст (0 байт).
Есть идеи, что я делаю не так или как запустить больший пакет?