Рассмотрим следующий код: __global__ void kernel(int *something) { extern __shared__ int...
Как использовать библиотеку CUFFT (из nVidia CUDA SDK 4.0.13), которая, насколько мне известно,...
Будет ли __syncthreads () вызывать мертвую блокировку, если ее выполняют только несколько потоков?...
Я искал некоторую информацию о кодировании CUDA (язык nvidia gpu) с помощью C #.Я видел несколько...
Это мой код, инициализирующий матрицу d_ref и копирующий ее на устройство.Я не уверен, правильно ли...
Как создать массив в разделяемой памяти без изменения ядра с помощью шаблонов, как видно из...
это мой код #include "stdafx.h" #include <iostream> using namespace std; #define n...
cuda-memcheck сообщает эту информацию для режима выпуска ядра CUDA: ========= Error: process...
Кроме того, я заметил, что моя программа c (с использованием CUDA 3.2) имеет виртуальный размер 28...
Как я могу определить, является ли следующий доступ к памяти объединенным или нет: // Thread-ID int...
У меня есть программа CUDA с огромным доступом к памяти, которые «случайны» и, таким образом,...
У меня есть программа, в которой я делаю кучу вычислений на GPU, затем я выполняю операции с...
Я сделал несколько попыток реализовать эффективный алгоритм шифрования rc4 в cuda. Я использовал...
В системе Linux с несколькими графическими процессорами, как вы можете определить, какой...
Я использую программу Linux time для измерения времени работы моей программы CUDA, и она показывает...
Для учебника, который я пишу, я ищу "реалистичный" и простой пример тупика, вызванного незнанием...
Когда я вызываю ядро с некорректно установленными параметрами (например, более 512 потоков на...
1) Я хочу извлечь код ptx из exe-файла CUDA и использовать этот код ядра в другой программе. Есть...
Когда я компилирую свой код CUDA с помощью NVCC, и я уже определил переменную предварительной...
У меня есть что-то вроде: __constant__ double PNT[ NUMCOORDS ]; __device__ double PNT[ NUMCOORDS ];...
У меня есть b количество блоков, и каждый блок имеет t количество потоков. Я могу использовать...
Я сталкивался с двумя функциями __cudaRegisterFatBinary() и __cudaRegisterFunction() Я понимаю, что...
Я пытаюсь использовать Nsight для отладки следующего кода: __device__ void change(int shared[]) {...
После вызова функции test я печатаю массив dtr1.Я ожидаю получить 100 для всех элементов, но я не...
FSPB_main.cpp int main(int args, char* argv[]){ ....... float *d_a; cudaMalloc( (void**)&d_a,...