У меня есть несколько ответов для вас.
Когда дело касается веб-приложений, балансировщики нагрузки должны предоставлять то, что называется Session Stickyness .Это означает, что после выбора сервера для обслуживания клиентского запроса все последующие запросы будут направлены на один и тот же узел, пока сеанс активен.Конечно, это не обязательно, если ваше веб-приложение не зависит от какого-либо состояния, которое должно быть сохранено (т.е. без состояния, без сеанса).
Я думаю, что это может ответить на ваш третий и, возможно, даже на второй вопрос.
Ваш первый вопрос о том, как внутренне работают балансировщики нагрузки.Поскольку я не являюсь экспертом в этом, я могу только догадываться, что балансировщик нагрузки, о котором говорит каждый клиент, измеряет время отклика ping для получения оценочной величины нагрузки на сервер.Возможно, можно использовать более сложные методы.