Я использую контейнерную балансировку нагрузки (NEG на GKE), и я хотел бы спросить, есть ли какая-либо опция, что один и тот же одиночный запрос на балансировщик нагрузки может обрабатываться дважды (или более раз) - давая больше pods.
У меня есть подозрение, что это происходит только из-за NEG (нет возможности отправить больше запросов из моего приложения), и в соответствии с зарегистрированным временем я нашел 3x одинаковую метку времени (в секундах) этого запроса LB (этот журнал собирается со всех модулей).
k8s окончательные конфигурации: https://gist.github.com/Barbarossa-42/86aac72da68c9e95a726e0845334d68a
ОБНОВЛЕНИЕ: это происходит при достижении времени ожидания LB или при падении модуля , Для меня это странное поведение. Зачем отправлять этот запрос снова в другой (рабочий) модуль?
Спасибо за любую помощь