Существует ли список / книга, описывающая проверенные случаи сложных сетевых проблем в сервисах * (будь то серверная / микросервисы / p2p / SOA) архитектура?
Что я нашел:
- Google (самый медленный 1%, ошибки жестких дисков, отображаемые с помощью профилирования RPC, решаемые с помощью трассировок)
- Uber (самый медленный 1%, RPC для скользящих окон,10 тыс. Запросов к базе данных при обходе коллекции, решаемых с помощью трассировок)
- Netflix (узлы-сбои, решаемые с помощью vizceral + chaosmonkey)
- Facebook (междунородная связь, решено с помощью новой архитектуры центра обработки данных)
- YouTube (проблемы масштабирования БД -> решено с помощью базы данных vitess)