AWS SageMaker - обучение локально, но развертывание на AWS? - PullRequest
0 голосов
/ 26 апреля 2018

У меня есть следующий вызов с SageMaker:

  • Я скачал одну из тетрадей учебника (https://github.com/awslabs/amazon-sagemaker-examples/blob/master/sagemaker-python-sdk/tensorflow_abalone_age_predictor_using_keras/tensorflow_abalone_age_predictor_using_keras.ipynb)
  • Я провел тренинг локально (успешно), изменив следующую строку:

    abalone_estimator = TensorFlow(entry_point='abalone.py',
                           role=role,
                           training_steps= 100,
                           evaluation_steps= 100,                                 
                           hyperparameters={'learning_rate': 0.001},
                           train_instance_count=1,
                           **train_instance_type='local'**)
    
    abalone_estimator.fit(inputs)
    
  • Затем я хотел развернуть мою модель в AWS со следующей строкой, но, похоже, SDK развертывает ее локально (она не дает сбоя, я просто вижу, что она работает на моей машине)

    abalone_predictor = abalone_estimator.deploy(initial_instance_count=1, instance_type='ml.m4.xlarge')

Какие-либо советы о том, как это исправить, чтобы он был развернут в AWS, или, в качестве альтернативы, заново загрузить мою модель обучения и развернуть ее в AWS с нуля?

Большое спасибо, Stefan

1 Ответ

0 голосов
/ 26 апреля 2018

Проще запустить тренировку снова в SageMaker. В противном случае, вот шаги, которые вам придется сделать.

  1. Возьмите файл контрольных точек, сгенерированный во время обучения, и преобразуйте их в модели обслуживания tenorflow.
  2. Заархивируйте их в определенном формате и загрузите на S3
  3. Затем создайте оценщик, как вы делали выше, и сделайте вывод.

Если вам нужны подробности по каждому из указанных выше шагов, дайте мне знать, но если ваш набор данных не слишком большой, я бы сказал, просто переучитесь на SageMaker.

...