У нас есть приложение-колба, которое использует много памяти для моделей ML, и я пытаюсь уменьшить объем памяти, используя опцию Gunicorn preload
, но когда я добавляю флаг --preload
и внедряю это (с -w 4
(к док-контейнеру, работающему на GKE), он будет обрабатывать всего несколько запросов, а затем зависать до истечения времени ожидания, после чего gunicorn запустит другого работника для его замены, и произойдет то же самое. Пока не ясно, сколько запросов обработает каждый работник перед зависанием (возможно, всего 1 ... возможно, несколько)
Время ожидания превышает 10 минут, поэтому кажется, что оно зависает бесконечно.
Этого не произойдет, если я уберу флаг --preload
.
Что это за флаг --preload
, который может вызывать зависание рабочих на неопределенное время?