Я видел статей, рекомендующих , что запросы ресурсов / лимит должны быть реализованы. Тем не менее, я не нашел ни одного, который обсуждал бы на какие числа для заполнения.
Например, рассмотрим контейнер, использующий нулевой процессор в режиме ожидания, 80% при обычных пользовательских запросах и 200% процессора при некоторых редких запросах:
- Если в качестве запроса ЦП указать 2000 м, то ядро большую часть времени будет бездействовать
- С другой стороны, если я запрашиваю 800 м, и несколько модулей одновременно достигают предела своего ЦП, тогда издержки переключения контекста пнут в
Есть также такие случаи, как
- Внутренние инструменты, которые простаивают большую часть времени, а затем переходят на 200% при активном использовании
- Приложения с разным временем пиковой нагрузки. Например, SaaS, который люди используют в рабочее время, и чат-бот, который начинает загружаться после того, как люди уходят с работы. Было бы хорошо, если бы они могли разделить неиспользованную емкость.
В идеале вертикальный модуль автоматического масштабирования , вероятно, решит эти проблемы автоматически, но сегодня он все еще в альфа-версии.