Обслуживание моделей от Databricks mlflow до Sagemaker - PullRequest
0 голосов
/ 25 октября 2019

Я могу успешно использовать mlflow из databricks (cloud.databricks.com) - могу регистрировать события и записывать в файл. Сейчас я пытаюсь развернуть модель в AWS SageMaker и следую этой статье за нее. У меня есть URL-адрес ECR и URI модели, однако я получаю "Операция развертывания завершилась со следующим сообщением об ошибке:« Произошла неизвестная ошибка SageMaker. Пожалуйста, смотрите журналы консоли SageMaker для получения дополнительной информации. "" при запуске команды mlflow.sagemaker.deploy () . Я не смог найти ничего в журналах CloudWatch, и я не уверен, где находятся журналы консоли SageMaker.

Я попытался создать модель с помощью этой команды - "mlflow sagemaker build-and-push-container --build" . Впервые я получил эту ошибку - "PermissionError: [WinError 32] Процесс не может получить доступ к файлу, поскольку он используется другим процессом: 'C: \ Users \ ADMINI ~ 1.AGI \ AppData \ Local \ Temp \tmpjjwu05xv '", во второй раз я получил эту ошибку - " botocore.exceptions.NoCredentialsError: Невозможно найти учетные данные ". Я запускаю эту команду из папки mlruns на моем ПК.

Я вижу, что в SageMaker создается конечная точка модели, однако развертывание завершается неудачно, так как нетизображение в ECR. Я убедился, что на моем ПК запущена докер (запущена с правами администратора). Пожалуйста, дайте мне знать, что мне не хватает.

Редактировать 1:

Я экспортировал файл Databricks на свой локальный компьютер и открыл его через блокнот jupyter. Когда я запустил эту команду - " mlflow.sagemaker.run_local (model_uri, port = 5001, image = 'mlflow-pyfunc', flavour = None) ", я получил это: 2019/10 /29 19:26:50 ИНФОРМАЦИЯ mlflow.sagemaker: запуск образа докера с путем C: \ Users \ 10261 \ AppData \ Local \ Temp \ tmp_wf3tk63 \ model 2019/10/29 19:26:50 ИНФОРМАЦИЯ mlflow.sagemaker: выполняется: dockerзапустите -v C: \ Users \ 10261 \ AppData \ Local \ Temp \ tmp_wf3tk63 \ model: / opt / ml / model / -p 5001: 8080 -e MLFLOW_DEPLOYMENT_FLAVOR_NAME = python_function --rm mlflow-pyfunc serve

Затем я перешел в эту папку (C: \ Users \ 10261 \ AppData \ Local \ Temp \ tmp_wf3tk63 \ model) из командной строки cmd и выполнил это -> mlflow sagemaker build-and-push-container --build, но получите это - Успешно построенный 701b67d2e9f6 Успешно помеченный mlflow-pyfunc: последнее ПРЕДУПРЕЖДЕНИЕ БЕЗОПАСНОСТИ: Вы создаете образ Docker из Windows на хосте, отличном от Windows. Все файлы и каталоги, добавленные в контекст сборки, будут иметь права доступа «-rwxr-xr-x». Рекомендуется перепроверить и сбросить разрешения для конфиденциальных файлов и каталогов. 2019/10/29 19:56:57 ИНФОРМАЦИЯ mlflow.sagemaker: перевод изображения в ECR 2019/10/29 19:56:58 ИНФОРМАЦИЯ mlflow.sagemaker: перевод изображения докера mlflow-pyfunc в 919490798061.dkr.ecr.us-west-2.amazonaws.com/mlflow-pyfunc:1.3.0 «$» не распознается как внутренняя или внешняя команда, работающая программа или пакетный файл.

...