Я предполагаю, что у вас есть четыре процесса и четыре устройства, хотя ваш вопрос предполагает, что у вас есть пять процессов и четыре устройства, что означает, что ручное планирование может быть предпочтительным (с устройствами Tesla в «общем» режиме).
Самое простое - использовать nvidia-smi, чтобы указать, что устройство Quadro "запрещено для вычислений". Вы также можете указать, что Teslas являются «исключающими вычисления», то есть только один контекст может присоединиться к каждому из них в любой момент времени.
Запустите man nvidia-smi для получения дополнительной информации.