У нас есть два сервиса A (на основе Java) и B (на основе Python).Начиная 1 экземпляр A и 8 экземпляров B. A связывается с B через grpc и использует посланника в качестве прокси-сервера.Из-за ограничений, B является однопоточным.когда нагрузка на А увеличивается, задержка вызовов на В резко возрастает.Из графиков посланников я не вижу ожидающих запросов.Связи здоровы.Задержка на B в среднем одинакова.
Пытаетесь понять, помещает ли grpc запросы в очередь?Если да, как я могу проверить метрики очереди.