На самом деле, ваше приложение уже делает это, поскольку вы не добавили конфигурацию warmup
в свой app.yaml, как вы можете видеть в этой документации .
Однако, у вашего экземпляра все еще будут свои ограничения, и когда они будут достигнуты, балансировщик нагрузки будет искать экземпляр, доступный для обработки запросов, который, вероятно, будет более старым экземпляром, который все еще работает.
Итак, решение для Ваша проблема состоит в том, чтобы проверить и изменить конфигурацию балансировщика нагрузки для ваших экземпляров, однако, как вы можете видеть на этом сообщении сообщества , это будет возможно только при использовании App Engine Flexible, поскольку в App Engine Standard это управляется Google Cloud, и вы не можете его настроить.
Если вы используете App Engine Flexible, вы можете проверить эту документацию , чтобы узнать, как добавить группу экземпляров в балансировщик нагрузки, а также как выбрать балансировщик нагрузки , который наилучшим образом соответствует потребностям вашего приложения.
Надеюсь, это поможет.