Наиболее перспективный вариант - найти способ включить мультиплексирование TCP между прокси / LB и внутренними серверами.
TCP-мультиплексирование - это метод, используемый в основном балансировщиками нагрузки и контроллерами доставки приложений (но также некоторыми автономными решениями по ускорению веб-приложений), который позволяет устройству «повторно» использовать существующие TCP-соединения.Это похоже на то, как постоянные соединения HTTP 1.1 работают в том, что одно HTTP-соединение может использоваться для извлечения нескольких объектов, что снижает влияние накладных расходов TCP на производительность приложений.
Мультиплексирование TCP допускает то же самое для приложений на основе TCP (обычно HTTP / web), за исключением того, что вместо повторного использования, ограниченного только одним клиентом, соединения могут использоваться повторно для многих клиентов, что приводит кболее высокая эффективность веб-серверов и более быстрые приложения.
Еще одно хорошее объяснение мультиплексирования TCP можно найти здесь .
Другой вариант - добавить дополнительные экземпляры прокси впул за сетевым балансировщиком нагрузки L4 и установите разумное значение для одного экземпляра.Каждый прокси будет нести определенную нагрузку без проблем.Если вам нужно обрабатывать периодические посылки в нагрузке, вы можете установить стратегию автоматического масштабирования для пула прокси.