Cuda 4 межпроцессорная синхронизация - PullRequest
1 голос
/ 04 апреля 2011

Кто-нибудь успешно тестировал эту функцию на Cuda4? Кажется, я не могу заставить его работать правильно, не уверен, что это ошибка в моем коде или функция еще не полностью реализована.

Например, я хочу сделать вызов ядра после копирования памяти из 1 графического процессора в другой. Поток 0, mem0 создается в gpu0, поток 1, mem1 создается в gpu1. Оба Ферми Тесла (C2070)

cudaMemcpyAsync( mem1, mem0, size, cudaMemcpyDefault, stream0 );
cudaEventRecord(P2Pevent, stream0);

cudaStreamWaitEvent(stream1, P2Pevent, 0);
cudaKernel<<<block,thread,0,stream1>>>(mem1);

Иногда кажется, что память еще не готова к ядру, поэтому результат неверен. Если я добавлю cudaDeviceSynchronize на Gpu0, он будет работать нормально.

Спасибо

1 Ответ

0 голосов
/ 05 апреля 2011

Это ошибка в моем коде! Работает правильно Спасибо, ребята

...