Я ищу какой-нибудь совет, и я был бы вечно благодарен, если бы кто-нибудь смог указать мне правильное направление.
У меня есть контейнер docker, который я использую для проведения машинного обучения на основе обнаружение / отслеживание объектов по наборам видеокадров. В настоящее время я запускаю экземпляр ec2 с этим контейнером docker, а затем отправляю пакеты по 30 кадров в последовательном режиме. Если, конечно, это слишком медленно.
Я хотел бы настроить систему kubernetes, которая может go от нулевых работающих контейнеров до 50+, а затем сразу до минимума, необходимого. Каждый контейнер требует около 8 ГБ ОЗУ в зависимости от размера модели, но может работать на ЦП. Мне нужно, чтобы они выполнялись в течение примерно одной минуты, чтобы обрабатывать входящие изображения параллельно, а затем завершаться, уменьшая до нуля активных контейнеров после завершения обработки видео. Таким образом, отправьте небольшие кластеры по 30 кадров в кластер, масштабируйте их, а затем сразу же уменьшите.
Мне удалось настроить кластер kubernetes в облаке Google, но я не могу понять узнайте, как можно быстро уменьшить его до нуля после завершения задания. После того, как работа будет выполнена, запускать столько контейнеров будет очень дорого.
Кто-нибудь сможет указать мне правильное направление? Могу ли я сделать это с помощью gke? Я должен попробовать другой сервис?
Заранее большое спасибо за помощь.
N