Резюме: Как избежать потери производительности, вызванной различной рабочей нагрузкой для разных...
У меня есть 1D массив "A", который состоит из множества массивов "a", например: Я реализую код для...
При компиляции следующего фрагмента кода с использованием nvcc -c mag_cuda.cu: //Standard Libraries...
Во всех примерах выполняется сканирование массивов, кратных 32. В самых быстрых примерах...
У меня есть сложное приложение Cuda C ++, которое работает нормально, пока я не соберу код cuda -g...
Когда я пытаюсь скомпилировать мой файл .cu, используя nvcc -c, возникает следующая ошибка:...
После длительного поиска я все еще не могу решить эту проблему. У меня есть два вектора: x = [a1, .
Предположим, что поток ядра пытается обновить 4 разных места в общей памяти.Могу ли я заставить эту...
В настоящее время я использую cmake-gui для компиляции yolo darknet на https://github
У меня есть ядро, которое много раз использует __constant__ памяти и нуждается в копировании...
Очень плохо знакомы с CUDA и C ++, однако работали над некоторыми проблемами, которые я заметил.Я...
изображение: docker тензор-поток / тензор-поток: 1.10.0-devel-gpu-py3 os: ubuntu 16.04 cuda: 9.0
Я пытаюсь скопировать входной массив cuda в массив с общей памятью.Первые n значений отлично...
Я хочу реализовать алгоритм в CUDA, который принимает входные данные размера N и использует N ^ 2...
Это код для создания матрицы на GPU и распечатки ее на CPU.Может кто-нибудь сказать мне, где я иду...
Я обнаружил, что поддержка cuda использует ключевое слово «template» для кода, теперь я хотел бы...
У меня есть программа CUDA, в которой одна деформация требует доступа (например) к 96 байтам...
Я вижу некоторые похожие термины при чтении иерархии памяти графических процессоров, и, поскольку в...
Для некоторых профилей приложений CUDA я вижу, что значение локального коэффициента попадания...
Я пытаюсь ускорить шифрование с использованием алгоритма RSA с использованием CUDA.Я не могу...
У меня есть некоторый код C-CUDA, который содержит встроенную сборку PTX , которая компилирует...
Насколько я понимаю, доступ к памяти только 4 байтами, 8 байтами или 16 байтами на каждый поток...
Что касается руководства по CUDA, большая часть данных отправляется на устройство посредством...
Я создал виртуальную среду, используя anaconda python. Я установил Cuda Toolkit в созданной среде....
Я хочу спроектировать ядро для одновременного добавления пар строк матриц, но я не знаю, как это...