Была ли у вас возможность проверить это руководство по GCP, как правильно измерить задержку приложения в зависимости от конкретного используемого балансировщика нагрузки?
Стоит упомянуть здесь, что ваш сценарий попадает в приложение с категорией «Балансировка нагрузки прокси HTTP (S) / TCP / SSL» (GCE Ingress Controller создает интерфейс HTTP Loadbalancer для вас Ingress -> Service -> Pod (Application) ))
Вы упомянули, что используете PING для тестирования задержки вашего приложения. Согласно учебному руководству GCP, при выполнении команды curl следует использовать метод Time To First Byte (TTFB) при проверке HTTP-запроса к веб-серверам (точная команда находится в ссылка, которой я поделился).
Вы также можете использовать Stackdriver Trace для детализации данных о задержке (для рабочих нагрузок GKE вам необходимо использовать клиентские библиотеки для их генерации)
Надеюсь, это поможет вам двигаться дальше.