Я использую своего рода балансировщик нагрузки в небольшом кластере, который способен достигать> 2000 об / мин для запросов с нулевой продолжительностью (те, которые немедленно удовлетворяются рабочими узлами).Но как только запросы перестают иметь нулевую продолжительность и начинают принимать даже 1 мс, производительность сразу падает в 10 раз.Данные, передаваемые в обоих направлениях, идентичны и имеют размер около 2 КБ.Это, безусловно, не связано с насыщением кластера или пропускной способностью сети, поскольку запросы 200rps 1 мс - это очень маленькая нагрузка, а сеть - 10 Гбит.Кроме того, загрузка ЦП составляет всего около 2-5% как для балансировщика нагрузки, так и для рабочих узлов.
Интересно, может ли это быть связано с каким-то патологическим поведением планировщика ОС или сетевого стека ОС(для очень коротких взаимодействий существует особый случай).
Как я могу диагностировать причину?Какие перфоунтеры смотреть?Какие инструменты или методологии использовать?
(На всякий случай, если кто-то просто знает ответ на мою конкретную проблему, я говорю о «WCF-брокере» MS HPC Server 2008 R2, работающем на Windows Server 2008 R2 поверхHyper-V)