App Engine Гибкая среда в настоящее время поддерживает только автоматическое масштабирование на основе использования целевого процессора (см. doc для настроек масштабирования).
Также обратите внимание, что вы не можете установить фактическое количество запущенных экземпляров с автоматическим масштабированием, а только значение "max_num_instances". Вы можете обновить его до более высокого значения программно с помощью метода apps.services.versions.patch API администратора App Engine, но автоматическое масштабирование все равно решит создавать новые экземпляры только на основе использования процессора.
Наилучший вариант, как вы упомянули, - разрешить одновременные запросы и многопоточность, чтобы использовать каждый экземпляр с максимальным потенциалом. Затем вы можете настроить значение target_utilization процессора, чтобы при необходимости создавать новые экземпляры.