https://github.com/DetectionTeamUCAS/R2CNN_Faster-RCNN_Tensorflow/blob/master/tools/inference.py
Я использую код R2CNN. Этот код для пакетного размера 1, и он использует только 30 ~ 40% моего графического процессора в режиме вывода. Каковы возможные методы, которые я могу попытаться использовать на 90% при меньшем времени выполнения?
1007 * Это код, который я использую. Python 2.7 и тензор потока 1.2
Проблема в том, что мне нужно запустить огромное количество изображений для вывода, и я ограничен только 1GPU (gtx2080).
Я попытался многопроцессорным путем создания 2 процесса и их параллельная работа.
Для этого я смог получить максимальное использование графического процессора около 80%. Я узнал об этом по команде nvidia-smi -l 1.
Но улучшения во время выполнения не так много. Так что, если вы можете предложить какие-либо методы, это было бы очень полезно.