Почему вы ожидаете, что загрузка графического процессора достигнет 100%, когда вы запустите прогноз нейронной сети для одного изображения?
Использование графического процессора за единицу времени (например, 1 секунда). Это означает, что, когда алгоритм нейронной сети завершился до истечения этой единицы времени (например, в течение 0,5 с), тогда в остальное время графический процессор может использоваться другими программами или не использоваться вообще. Если графический процессор не используется никакими другими программами, тогда вы не достигнете 100%.