Несколько мыслей по этому поводу, так как я думаю, что ответ может быть многогранным.
Я прочитал, что обеспечение того, что соединения являются TLSv1.2, может уменьшить возникновение проблемы сброса соединения этого типа.
Вы можете принудительно использовать TLS 1.2 на стороне сервера, настроив ваш API-шлюз, который будет использоваться вместе с именем пользовательского домена API-шлюза или иметь трафик c, перенаправленный через дистрибутив Cloudfront. И пользовательские доменные имена, и Cloudfront позволяют включать только TLSv1.2.
Если вы управляете клиентским кодом, вы также можете убедиться, что они настроены на использование TLSv1.2.
Вверху из-за этого при работе с сетевым трафиком c всегда происходят сбои в сети, и для клиентского кода лучше всего использовать логи повторных попыток c с добавочным откатом на месте, чтобы все происходило автоматически.
Мы использовали другой стек технологий поддержки, но столкнулись с похожими проблемами, когда наша клиентская база выросла, и мы начали получать больше трафика c. Мы контролировали наш клиентский код, поэтому добавили туда логи повторных попыток c, которые сделали наших клиентов намного более надежными. Вот сообщение в блоге AWS о том, что это хорошо читать на топи c: https://aws.amazon.com/builders-library/timeouts-retries-and-backoff-with-jitter/