Я работаю над tenorflow-gpu и pyqt5 для системы обнаружения объектов.
Я разработал проект, основанный на модели нейронной сети, который обучается по тензорному потоку, и это хорошо, но мне нужно ускорить уровень обнаружения.
Мой графический процессор - GTX 1060, а процессор - Corei7.
Как использовать ядра CUDA для разделения вычислений?
Я искал много статей и Я несколько раз спрашивал об этом в * переполнении стека **, но ответа не было.
Как я могу использовать tenorflow-gpu для программирования ядер CUDA с помощью таких библиотек, как PYCUDA или numba или CUPY?
Я задал этот вопрос несколькими способами, но я ищу правильный подход к использованию CUDA для программирования ядер GPU (GTX1060 имеет 1280 ядер CUDA, но Corei7 имеет 8 ядер, и, предоставляя вычисления для GPU, программа в больших масштабах ускорится )