выпуск: По мере увеличения объема данных, обрабатываемых внутри цикла, который находится внутри...
Мне нужна функция, которая выполняет операцию y = y + s*A*x на CUDA.Где y - сложный вектор...
Я использую CMake для компиляции проекта CUDA, который содержит статическую библиотеку и основной...
Я использую CUDA для итеративного алгоритма Карацубы, и я хотел бы спросить, почему одна строка...
Я пытаюсь кросс-компилировать файл CUDA в AARCH64. Для этого у меня есть полностью рабочий набор...
Я использую CUDA 9.1 и visual stdio 2017 15.4.4 для ускорения вычислений, и у меня возникает...
Я пытаюсь построить проект со статической библиотекой, используя CUDA вместе с кодом C ++. Нужно...
У меня проблемы с использованием cudaMemset в переменной устройства. Можно ли использовать ссылку...
В настоящее время я использую движок трассировки лучей Optix в Visual Studio.Моя проблема состоит в...
Я просто настроил среду отладки Parallel Nsight и начал удаленную отладку моей программы CUDA. Я...
Можно ли просматривать регистры PTX при переходе через встроенный PTX в Parallel Nsight? Я могу...
Это вопрос о том, как определить сетку CUDA, размеры блоков и нитей.Это дополнительный вопрос к...
Что пришлось изменить / добавить поставщикам, чтобы их графические процессоры могли работать с...
Я новичок в CUDA, и я пытался понять, что я делаю здесь не так. CUDA занимает больше времени, чем...
Я новичок в CUDA. Может кто-нибудь объяснить мне, пожалуйста, почему этот код является...
Мне нужно сделать расчет как: A [x] [y] = сумма {от z = 0 до z = n} {B [x] [y] [z] + C [x] [y] [z]}...
В параллельных вычислениях обычно это первый шаг, чтобы разделить проблему происхождения на...
Я занимаюсь преобразованием PTX, записанного в виде отдельного файла, во встроенный PTX. В...
При записи PTX в отдельный файл параметр ядра может быть загружен в регистр с помощью: .reg .u32...
Я должен использовать разделяемую память размером 64 элемента, вдвое больше, чем 32 банка. Таким...
Я получаю следующее предупреждение, которое я не понимаю при компиляции кода CUDA: CUDACOMPILE:...
Возможно ли, что потоки занимают больше времени, чем обычные программы CUDA? Гарантируется, что...
Как следует из следующей ошибки, вызов функции хоста ('rand') в ядре недопустим, и мне интересно,...
Память __shared__ в CUDA требует известного размера во время компиляции.Однако в моей проблеме...