задержка экземпляра в Google App Engine - PullRequest
3 голосов
/ 28 января 2012

Я запускаю бесплатное приложение и использую 1 максимальный бездействующий экземпляр с использованием среды исполнения Python GAE.

Согласно http://code.google.com/appengine/docs/adminconsole/instances.html,

Задержка вашего приложения имеет наибольшее влияниена количество экземпляров, необходимых для обслуживания вашего трафика.Если вы обрабатываете запросы быстро, один экземпляр может обработать множество запросов.

Похоже, что лучше всего настроить ползунок в «Настройках приложения» на минимальную задержку.

Однако, согласно http://code.google.com/appengine/docs/adminconsole/performancesettings.html#Setting_the_Minimum_Pending_Latency,

кажется, что наличие высокой задержки хорошо для предотвращения скачков нагрузки от запуска новых экземпляров.

Таким образом, задержка в основном компромисс между способностью реагировать наПики запросов (высокая задержка) против количества запросов, обработанных за данный период времени (низкая задержка)?

1 Ответ

4 голосов
/ 29 января 2012

«Задержка ожидания» относится к тому, как долго запрос может находиться в очереди, прежде чем App Engine решит развернуть другой экземпляр.Если все экземпляры вашего приложения заняты, когда приходит запрос, запрос будет ожидать в очереди для обработки следующим доступным экземпляром.Если он там выше минимума, App Engine может решить запустить новый экземпляр для обработки запроса.(Существует также параметр максимальной задержки ожидания, который вы можете настроить.)

Минимальная задержка ожидания настраивается, потому что запуск нового экземпляра занимает время и стоит денег.Увеличенная минимальная задержка в ожидании означает, что App Engine будет дольше удерживать ожидающие запросы (и заставлять их ждать) перед запуском новых экземпляров, что повышает стоимость экземпляра и позволяет обрабатывать больше трафика.Меньшая минимальная задержка в ожидании означает, что App Engine будет запускать новые экземпляры чаще при увеличении трафика.

Термин «задержка» просто означает, сколько времени требуется приложению для ответа на запрос.Чем быстрее ваше приложение сможет отвечать на запросы, тем больше запросов сможет обработать один экземпляр, и, как правило, короче будет очередь запросов.Низкая задержка - это всегда хорошо, но приложение должно быстро выполнить то, что ему нужно.

...