В случае, если вы используете одну и ту же модель для всех процессов, рассмотрите возможность использования многопотокового вывода OV. Используя это, вы можете загрузить одну сеть и следующую, чтобы создать несколько запросов на вывод. Используя это, вы получите лучшую загрузку ЦП (если сравнивать с выполнением одного запроса на вывод по нескольким ядрам) и, как результат, лучшую пропускную способность.
Чтобы понять, как использовать многопотоковый вывод, взгляните на inference_engine / samples / python_samples / benchmark_app / benchmark sample
Также вы можете использовать пример эталонного теста для поиска в сетке, чтобы найти оптимальную конфигурацию (количество потоков, размер пакета).