Мы запускаем веб-приложение Koa в 5 контейнерах Fargate. Они довольно простые API REST / REST с Koa над Mongo Atlas. Мы начали проводить тестирование емкости и заметили, что серверы узлов начали значительно замедляться с большим запасом свободного пространства на процессоре (на уровне 30%), памяти (на уровне или ниже 20%) и Mongo (по-прежнему возвращающихся менее 10 мс).
Чтобы дополнительно проверить это, мы удалили операции Монго и просто забили наши конечные точки проверки здоровья. Мы видели большую пропускную способность, но при 25% ЦП произошла значительная деградация, а на 40% ЦП произошел сбой Node.
Наши задачи (контейнеры) в fargate: ЦП: 2048 (2 «виртуальных ЦП») и память4096 (4 концерта). Мы увеличили наш ulimit nofile до 64000, а также установили max-old-space-size равным 3,5 ГБ. Это не привело к значительной разнице.
Мы также не видим значительных задержек в нашем балансировщике нагрузки.
Я ожидаю, что ЦП или память поднимутся намного выше, прежде чем система начнетиспытывают проблемы. Есть идеи, где может существовать узкое место?