Я думаю, что мое ядро связано с памятью (потому что большая часть кода GPGPU связано с памятью),...
Мой архив ядра использует 100%, но kernel time составляет всего 3%, а no time overlap between...
Я генерирую вывод препроцессора (.i) из Visual Studio, но также хочу сделать фактическую сборку....
Когда я запускаю свой файл .exe с использованием профилировщика, он показывает. Нажмите любую...
Я пытаюсь перенаправить демо-приложение из CUDA SDK, но получаю эту ошибку: Xlib: extension...
Извините за плохой заголовок. Я не мог придумать ничего лучшего. В каждом примере программ CUDA,...
У меня есть массив целых чисел, размер которых известен до запуска ядра, но не на этапе компиляции....
Мой вызов ядра завершается с ошибкой "недостаточно памяти".Это существенно использует кадр стека, и...
У меня проблемы с получением библиотеки CUSP (версия 0.2), работающей под Windows7 x64 и Visual...
Мой следующий код получил ошибку, когда он выполняется, некоторые веса графиков перезаписываются,...
Я пытаюсь сделать простой фреймворк Qt + Cuda на примере Helloworld.cu. Это самый простой Qt...
Когда я пытаюсь отладить произвольное приложение CUDA, например, Образец умножения или скручивания...
я знаю, как пересечь два отсортированных списка на ЦП, используя алгоритм O (n + m), где n и m -...
Я делаю некоторые расчеты и анализирую сильные и слабые стороны различных реализаций BLAS. Однако я...
Мне нужно перенести приложение для симуляции толпы на GPU, используя CUDA.Для этого я выполнил эту...
Я работаю над инструментом эмуляции трассировки GPU в Windows в рамках своей исследовательской...
При компиляции некоторого кода CUDA я получаю ошибку, что libcutil не может быть найден, даже если...
Как я могу реализовать механизм вращения вращения в форме while(variable == 0); где переменная...
Можно ли передавать данные из CPU в GPU без явной передачи их в качестве параметра? Я не хочу...
Вот вывод Compute Visual Profiler для моего ядра на GT 440: Подробности ядра: Размер сетки: [100 1...
Я обнаружил, что выравнивание для char1 равно 1, для char2 равно 2, для char3 равно 1 и для char4...
Я использую GTX 280, который имеет вычислительные возможности 1.3 и поддерживает атомарные операции...
Я пытаюсь скопировать некоторые вложенные структуры в память устройства для использования ядром в...
Как получить не только значение, но и положение максимального (минимального) элемента (res.val и...
Я хочу реализовать межблочный барьер в CUDA, но столкнулся с серьезной проблемой. Я не могу понять,...