Степень параллелизма, которую вы получаете, сильно зависит от рабочей нагрузки вашего приложения. Если ваши запросы связаны с процессором, вы будете обрабатывать только один запрос за раз. С другой стороны, если ваши запросы связаны с RPC, вы могли бы потенциально обслуживать десятки одновременных запросов. Тем не менее, есть два ограничения:
1. Размер экземпляра. Экземпляр F1 по умолчанию с частотой 600 МГц может обслуживать только столько одновременных запросов, прежде чем достигнет предела ЦП, перегрузит ваш экземпляр и приведет к значительному увеличению задержки.
2. Существует жесткое ограничение на количество одновременных запросов. Это зависит от реализации и может быть изменено, но на данный момент на python27 это 8.