Мне нужно найти минимальный индекс среди массива.это легко сделать, используя один поток, но я хочу...
У меня есть система GPU, на которой установлена CUDA 9. Мне нужна отдельная среда с CUDA 8. Итак,...
Давайте рассмотрим код CUDA на Mersenne Twister CUDA для произвольного числа потоков и предположим,...
Я пишу тестовый код, чтобы ознакомиться с параллельными атрибутами cudaMemcpyAsync. Когда я пытался...
В c/c++, мы можем использовать 1 bit для представления 0/1, но я понятия не имею, как выполнить эту...
Я использую следующий код: cuCtxCreate(&context, CU_CTX_SCHED_YIELD, device); int driverVersion...
Я попытался скомпилировать код из https://github.com/wilicc/gpu-burn, используя следующий Makefile
У меня есть модульные тесты с использованием вызовов взаимодействия на dll с использованием opencv...
Я пытаюсь внедрить Bitonic Sorter в CUDA и измерить его время в зависимости от размера массива для...
Следующая команда запускается для программы профилирования с nvprof. nvprof --profile-from-start...
Я делаю несколько простых параллельных вычислений в массиве с CUDA C ++. Все работает нормально,...
** РЕДАКТИРОВАТЬ: Я уточню свой вопрос Я использую C ++, GTX1070 Я выделяю массив CUDA, как описано:...
В качестве дополнительного вопроса к Использование Vulkan VkImage в качестве cuArray CUDA , как я...
Я использую API-интерфейсы CUDA для распараллеливания последовательного кода.Тем не менее, я...
Я попытался запустить следующий код с помощью Google Colab. #include <stdio.h> #include...
Я работаю над Cuda с C ++ 11 (я не думаю, что Cuda пока поддерживает более поздние версии C ++).У...
Как правильно использовать Vulkan VkImage в качестве CuArray CUDA? Я пытался следовать некоторым...
Я пытаюсь повысить скорость тестирования кода с помощью общей памяти.Код, включающий цикл while,...
Документация для cudaErrorIllegalAddress говорит: Устройство обнаружило инструкцию загрузки или...
Я читал в Руководстве по программированию CUDA о функциях шаблонов и работает ли что-то подобное?...
Я хочу профилировать часть кода.Например, мне нужен миллион записей из миллиона разного исполнения
Я пытаюсь использовать tenorflow и nvidia с докером, но появляется следующая ошибка: docker run...
Я столкнулся с проблемой точности моего кода, который выполняет ряд (128, 256, 512) инверсий...
Я работаю с графическим процессором и хочу получить серийные номера графического процессора. В...
Я хочу объединить два тензора вдоль измерения канала в cudnn. Тем не менее, я считаю, что такой...