Моя проблема в том, что я не знаю, как сформировать разумное ожидание для количества одновременных соединений. Предположительно на некотором уровне лучше отказаться от новых подключений, чем позволить всему замедляться, потому что слишком много обслуживаемых запросов.
Реальные рабочие нагрузки сложно симулировать, поэтому я ищу формулу, уже исследованную кем-то другим.
(Очевидная верхняя граница - это максимальный размер кучи, деленный на минимальный объем памяти, необходимый для обслуживания запроса, но даже это трудно измерить в среде с сборщиком мусора.)