У меня проблемы с выполнением cuda :: streams, интересно, что мне делать дальше, так как непотоковый код стоит столько же, сколько и поточный код
код извлечения и запуск примера simpleStreams https://github.com/Firststep2014/cuda-sample/tree/master/0_Simple/simpleStreams
-------result-------
Starting Test
memcopy: 5.12
kernel: 0.29
non-streamed: 5.33
4 streams: 5.20
Тем временем, попрактикуйтесь в запуске cuda_based opencv (cv :: cuda), например, выполняя 8 потоков с каждым потоком на каждый поток, однако параллелизма не обнаружено, как исключено
cv::parallel_for_(cv::Range(0,8),ParallelMulpitly_process(some argument));
for (int i=range.start; i<range.end; i++){
cv::cuda::Stream stream;
cv::cuda::multiply(some argument,stream);
cv::cuda::copyMakeBorder(some argument,stream);
}
GPU Device 0: «Tesla V100-PCIE-32GB» с возможностью вычислений 7.0 CUDA Версия 10.1.105