У нас есть приложение с типом аварийного переключения route53.В настоящее время у меня есть два API в двух с подключенными балансировщиками нагрузки.
- основной
- дополнительный
Оба API имеют URL-адрес проверки работоспособности HTTP: 80/health.
Тайм-аут 10 секунд .
Время между проверками работоспособности отдельного экземпляра 15 секунд .
Число последовательных успешных проверок работоспособности, необходимых для определения работоспособности экземпляра, составляет 2 запроса
Наконец, порог ошибки проверки работоспособности для маршрута 53 равен 10, а интервал запроса - 30 с.
Все работает нормально, но иногда, когда один из моих API не работает, нам приходится сталкиваться со средним временем простоя, равным примерно 5-10 минутам, что недопустимо.Любые предложения будут оценены.