Ваша проблема в том, что вы не используете реалистичное значение увеличения. AppEngine, как и большинство решений автоматического масштабирования, требует разумного количества времени для раскрутки нового оборудования. Во время этого процесса во время создания новых экземпляров задержка может увеличиться, если был большой и внезапный рост трафика.
Выберите значение увеличения, соответствующее типам всплесков / скачков, которые вы реально ожидаете увидеть на производстве, а затем запустите тест. Используйте значения из этого теста, чтобы решить, сколько экземпляров appEngine вы хотите «всегда включать», чем выше это значение, тем меньше будет влияние от скачка напряжения, но, очевидно, выше ваши затраты.