Есть ли способ запустить два cublasDtrsm одновременно в CUDA? - PullRequest
0 голосов
/ 26 декабря 2018

Я студент, и вот код CUDA, который я написал для одновременного запуска функции cublasDtrsm.

Похоже, что код выполнялся последовательно.потому что время выполнения практически одинаково как в последовательном, так и в одновременном режиме.(выполнено для 512,1024,2048 квадратных матриц).Код:

cublasHandle_t handle,handle2;

cudaStreamCreate ( &stream1) ;
cudaStreamCreate ( &stream2) ;

cublasCreate(&handle);
cublasCreate(&handle2);

cublasSetStream(handle, stream1);
cublasSetStream(handle2, stream2);

//cuBlas functions which I wanted to execute simultaneously
cublasDtrsm(handle,,,,....);
cublasDtrsm(handle2,,,,...);

Я что-то упустил?или есть способ решить это?

...