У меня есть нечто очень похожее на код: int k, no_streams = 4; cudaStream_t stream[no_streams];...
Я недавно работал с CUDA.Мне просто интересно, есть ли разница в производительности между CUDA и...
У меня возникли проблемы с выяснением, как добавить еще один каталог для одного проекта. В обычном...
Я написал некоторый код, чтобы попытаться поменять квадранты 2D-матрицы для целей БПФ, которая...
Я только начал программировать на CUDA, и все идет хорошо, мои графические процессоры распознаются...
Я бы хотел передать контекст Cuda между двумя независимыми процессами Linux (используя очереди...
Я пытаюсь скомпилировать блок примера кода, используя Thrust, чтобы помочь освоить немного CUDA. Я...
У меня есть код cuda, в котором я реализовал несколько 2D-БПФ C2C. Все они используют один и тот же...
Мое ядро широко использует регистры. При компиляции для 1.2 устройств --ptxas-options=-v сообщает...
Привет, у меня есть математическая функция (многомерная, что означает, что есть индекс, который я...
Как и в случае с CUDA, самые простые вещи иногда самые сложные ... Итак ... Я просто хочу...
Я использую калькулятор CUDA Occupancy, чтобы попытаться оптимизировать мое ядро CUDA. В...
Какое максимальное количество блоков в сетке может быть создано при запуске ядра?Я немного сбит с...
Я только что заметил, что одним из первых языков для Connection-Machine W.D. Hillis был * Lisp,...
Предположим, у меня есть код, который позволяет пользователю передать threads_per_block для вызова...
Я строю ядро для поэлементного умножения двух матриц, но по крайней мере с моими конфигурациями...
Я пытаюсь собрать OpenCV 2.2 с CUDA на моем Mac (используя Mac OS 10.6.7 и Xcode 4).Я следовал...
Я действительно новичок в CUDA и пытаюсь пройти 2D-массив. У меня есть следующий код, который...
Привет, у меня есть следующий фрагмент кода: #if USE_CONST == 1 __constant__ double PNT[ SIZE ];...
Привет, когда я компилирую с nvcc -arch=sm_13, я получаю: ptxas info : Used 29 registers, 28+16...
Если необходимо загрузить два int2 из памяти устройства в регистры, насколько хуже две...
Я только начал программировать на CUDA и пытался выполнить код, показанный ниже.Идея состоит в том,...
Я создал класс и передал его объект ядру cuda. Код ядра: __global__ void kernel(pt *p,int n) { int...
Привет, если у меня проблема в том, что каждый поток вычисляет что-то (считывает некоторые...
Попытка кодировать параллельную версию AES для работы на CUDA.После окончательного устранения...