У меня есть один главный сервис и несколько подчиненных сервисов.Главный сервис постоянно опрашивает тему, используя подписчика из Google PubSub.Ведомые сервисы - это REST API.Как только главная служба получает сообщение, она делегирует сообщение подчиненной службе.В настоящее время я пользуюсь сервисом ClusterIP в Кубернетесе.Некоторые из моих запросов долго выполняются, а некоторые довольно коротки.
Я иногда замечаю, что, если во время обработки длинного запроса возникает короткий запрос, он должен ждать, пока долго выполняющийся запросфинишируйте, хотя доступно много контейнеров, не обслуживающих трафик.Я думаю, что это из-за круговой балансировки нагрузки.Я пытался найти решение и искал подходы, такие как настройка внешнего HTTP-балансировщика нагрузки с входным и внутренним HTTP-балансировщиком нагрузки.Но я действительно смущен разницей между этими двумя и тем, что применимо для моего варианта использованияМожете ли вы предложить, какой из подходов решил бы мой вариант использования?