У меня есть приложение Flask, которому нужен графический процессор для одной из основных функций. Когда работает ускоренная функциональность GPU (назовем это gpu_func
), она использует значительно больше половины моей памяти GPU. У меня есть другие конечные точки, которые включают получение конфигов и файлов изображений, которые не используют графический процессор.
Теперь я совершенно новичок в этой концепции, но я думаю, что я мог бы хотеть использовать больше, чем один "рабочий" из оружия. в случае, если два пользователя вызывают конечную точку одновременно. Поскольку я знаю, что мой компьютер может обрабатывать только gpu_func
один раз за раз, я не хочу, чтобы эта конечная точка получала параллельные запросы. Но я хочу, чтобы все другие конечные точки могли получать параллельные запросы, даже если запущен gpu_func
.
Итак, каков лучший способ go по этому поводу? И какой самый простой способ?
PS: я почти уверен, что бегу nginx.