Как запустить пакет побольше с помощью AWS SageMaker Batch Transform - PullRequest
0 голосов
/ 04 октября 2018

Я создал модель XGBoost с AWS SageMaker.Сейчас я пытаюсь использовать его в пакетном задании преобразования, и все это довольно хорошо подходит для небольших пакетов.

Однако в файле размером ~ 16 МБ есть несколько больший пакет из 600 000 строк, и я не могу управлятьзапустить его за один раз.Я попробовал две вещи:

1.

Установка максимального размера полезной нагрузки задания преобразования на максимум (100 МБ):

transformer = sagemaker.transformer.Transformer(
    model_name = config.model_name,
    instance_count = config.inference_instance_count,
    instance_type = config.inference_instance_type,
    output_path = "s3://{}/{}".format(config.bucket, config.s3_inference_output_folder),
    sagemaker_session = sagemaker_session,
    base_transform_job_name = config.inference_job_prefix,
    max_payload = 100
    )

Однако я все ещеполучить сообщение об ошибке (через консольные журналы CloudWatch):

413 Request Entity Too Large
The data value transmitted exceeds the capacity limit.

2.

Установка для max_payload значения 0, которое, по спецификации, Amazon SageMaker должно интерпретировать как отсутствие ограничения размера полезной нагрузки.

В этом случае задание успешно завершается, но выходной файл пуст (0 байт).

Есть идеи, что я делаю не так или как запустить больший пакет?

1 Ответ

0 голосов
/ 27 октября 2018

Большинство алгоритмов SageMaker устанавливают свои собственные параметры выполнения по умолчанию с 6 МБ в MaxPayloadInMB, поэтому, если вы получаете 413 от алгоритмов SageMaker, вы, вероятно, превысите максимальную полезную нагрузку, которую они могут поддерживать.Предполагая, что каждая строка в файле меньше 6 МБ, вы можете исправить это, оставив MaxPayloadInMB не установленным для возврата к стандартному размеру алгоритма и установив для параметра SplitType значение «Строка», чтобы можно было разбить данные на более мелкие пакеты (https://docs.aws.amazon.com/sagemaker/latest/dg/API_TransformInput.html#SageMaker-Type-TransformInput-SplitType).

...