Вы предоставляете услугу с помощью NodePort, поэтому обратный прокси-сервер отсутствует, но вы напрямую подключаетесь к своим модулям. Это хороший выбор для начала. (Позже вы можете использовать Ingress)
То, что вы видите, это то, что только один Pod обрабатывает ваши запросы. Вы ожидаете, что каждый запрос будет сбалансирован по нагрузке для другого модуля. И ваше предположение верно, но балансировка нагрузки происходит не на уровне HTTP-запросов, а на уровне TCP.
Таким образом, когда у вас есть постоянное TCP-соединение и вы его повторно используете, вы не будете испытывать нагрузкубалансировка, которую вы ожидаете. Поскольку установление TCP-соединения является довольно дорогостоящим с точки зрения задержек, обычно проводится оптимизация, чтобы избежать повторного открытия новых TCP-соединений: HTTP keep-alive.
В большинстве сред и клиентов поддержка активности по умолчанию включена по умолчанию, это действительно такиди тоже. Попробуйте s.SetKeepAlivesEnabled(false)
и посмотрите, решит ли это вашу проблему. (Рекомендуется только для тестирования!)
Вы также можете использовать несколько разных клиентов, например, из командной строки с curl или отключить keep-alive в Postman.