MLFlow Registry высокая доступность - PullRequest
0 голосов
/ 28 апреля 2020

Я использую реестр mlflow, используя mlflow server (https://mlflow.org/docs/latest/model-registry.html). Сервер работает нормально. Если сервер по какой-либо причине дает сбой, он автоматически перезагружается. Но на момент перезапуска сервер недоступен.

Можно ли параллельно запустить несколько isntances за балансировщиком нагрузки? Это безопасно или возможно, что есть какие-то несоответствия?

1 Ответ

0 голосов
/ 02 мая 2020

Да, возможно иметь несколько экземпляров службы MLflow Tracker, работающей за балансировщиком нагрузки.

Поскольку сервер отслеживания не имеет состояния, вы можете зарегистрировать несколько экземпляров в реплицированной первичной БД в качестве хранилища. Второй горячий резерв может вступить во владение, если основной отказывает.

Что касается документации о том, как настроить реплицированные экземпляры вашего внутреннего хранилища, будет зависеть от того, какой из них вы выберете, мы не можем определенно документировать все различные сценарии. ios и их конфигурации.

Я бы проверил соответствующую документацию вашей серверной БД и подсистемы балансировки нагрузки, чтобы узнать, как объединять запросы к нескольким экземплярам сервера отслеживания MLflow, как переходить на резервный ресурс к горячему резервированию или реплицированной БД. или как настроить экземпляр БД с горячим резервированием.

Коротко: сервер отслеживания MLflow не имеет состояния.

...