kernel1 <<< blocks1, threads1, 0, stream1 >>> ( args ... );
...
kernel2 <<< blocks2, threads2, 0, stream2 >>> ( args ... );
...
У меня есть два ядра для одновременной работы,
и устройство GTX460, так что это архитектура Fermi.
Cuda toolkit и sdk имеют 3.2 rc.
Как и в приведенных выше кодах, два ядра закодированы для одновременной работы,
, но нет ответов от какого-либо ядра.
Есть ли какие-либо ограничения на то, что делают ядра?Два ядра разделяют некоторые данные
, и они имеют некоторую общую часть.
Если я закомментирую большую часть одной функции ядра, то программа останавливается.
Пожалуйста, помогите мне.