Надеюсь, вы можете помочь мне с этим!
Каков наилучший подход для получения и установки запроса и ограничения ресурсов для модулей?
Я думал об установке ожидаемого количества трафика и коде некоторых нагрузочных тестов, затем запустил один модуль с некоторыми «низкими пределами» и запускал нагрузочный тест до OOMed, затем снова настраивал (что-то вроде разгона) память до тех пор, пока не будет найдено узкое место. затем атаковать процессор, пока все не станет "стабильным" и так далее. Тогда я бы использовал этот «предел» в качестве «значения запроса» и использовал бы двойное значение «значения запроса» в качестве «предела» (или безопасного значения, основанного на результатах). Наконец, масштабируйте их для среднего трафика (фиксированное количество модулей) и установите правила автоматического масштабирования модулей для пиковых значений производительности.
Это хороший подход? Какие инструменты и показатели вы рекомендуете? Я использую Prometheus-оператор для мониторинга и Вегета для нагрузочного тестирования.
А как насчет вертикального автомасштабирования? ты использовал это? готово ли производство?
Кстати: я использую развернутое решение AWS с модулем terraform
Спасибо за чтение