У меня есть служба приложений Azure, на которой размещена веб-служба (2 экземпляра) с asp.net 4.7.1 MVC Web API, и она используется несколькими поставщиками в США, как в Azure, AWS, так и локально.
В настоящее время он обрабатывает около 18 тыс. Запросов в день, но иногда (1,2,3) раза в день я получаю уведомление об ошибке от поставщика о том, что время ожидания истекло.Иногда это только 1 поставщик, иногда это несколько поставщиков одновременно (в течение минуты или двух).
После возникновения проблем они волшебным образом исчезают так же быстро.Никаких перезапусков или чего-то еще, сервис просто снова работает нормально.Иногда сбои происходят в кучу.Как 3 не удается в течение нескольких минут, а иногда только один раз, даже в часы пик.Я не нашел шаблон вообще.Это происходило во время пикового трафика, а также, когда его практически не было.
Вот реальная проблема: если я проверяю наши собственные журналы, журналы IIS и журналы анализа приложений, то вообще нет никаких доказательствчто запрос (ы) пришел.Как будто они были полностью потеряны, прежде чем добраться до нас.
Если бы это было только от одного продавца, я бы винил их и пошел дальше.Но много раз это происходило с несколькими поставщиками в одно и то же время.Продавцы на совершенно разных побережьях, запускают совершенно разные продукты.
ЦП, ОЗУ, диск, длина очереди HTTP, TCP-соединения и все остальные известные мне метрики выглядят хорошо.
Фактические запросы, которые не выполняются, различаются, но ни один из них не требует значительных ресурсов.
Пожалуйста, у кого-нибудь есть идеи о том, в чем может быть проблема?