У меня есть задача транспонировать матрицу в CUDA, используя разделяемую память без конфликтов...
Это мой первый пост, и я должен сказать, что у меня нет опыта использования CUDA.Я строю алгоритм...
Я использую CUDA для рендеринга (используя raytracer) сцены на экран и хочу узнать, какие самые...
Этот вопрос является продолжением Интерпретация подробного вывода ptxas, часть I . Когда мы...
Я пытаюсь передать больше данных в мой графический процессор, чем у меня VRAM, что приводит к...
В моей системе установлен графический процессор, совместимый с CUDA (Nvidia GeForce 1060). При...
В последнее время я часто получаю RuntimeError: CUDA error: invalid argument при вызове таких...
Мне кажется, что должен быть способ написания кода, чтобы он мог работать как в CPU, так и в GPU.То...
Я перевожу программу c ++ 11, которая вычисляет силы контакта между парами частиц, в программу cuda
Я использую Visual Studio Code в Ubuntu, потому что я использую CUDA мне нужно использовать Nvcc, а...
Я провожу эксперимент по объединению памяти на Паскале и получаю неожиданные nvprof результаты. У...
Каково определение начала и конца запуска ядра в CPU и GPU (желтый блок)?Где граница между ними?...
У меня есть программа CUDA, которая запускается без ошибок, если ее оставить для запуска на...
Для некоторых программ (не только для одной) я вижу, что для большинства ядер загрузка кэша (l2 и...
Я пытаюсь использовать libtorch для своего проекта и собрал его из источников. Я сделал компиляцию...
Я изучаю Pycuda, но каждый раз, когда я заканчиваю запуск программы, что-то все равно занимает...
Я пытаюсь нарисовать кучу точек на экране с помощью взаимодействия Cuda 10.1 и OpenGL 4.6. Однако...
Я знаю, что в ядре numba cuda мы можем определять локальные и общие массивы. Также все переменные в...
Я пытался улучшить производительность медленного кода. Этот код использовал cblas, и я пытался...
Я пытаюсь нарисовать кучу точек на экране. Я использую CUDA для генерации данных (положение и цвет)...
У меня есть сигнал, что я выполняю БПФ, выполняю свертку с самим собой, а затем выполняю IFFT...
У меня есть следующая строка кода, gamma - это переменная процессора, которую мне нужно будет...
Я новичок в CUDA и Thrust, и я пытаюсь реализовать умножение матриц, и я хочу добиться этого,...
Насколько я знаю, atomicAdd может использоваться на общей памяти и глобальной памяти.Мне нужно...
Я хочу читать из памяти текстур, используя пользовательскую структуру (ushort8), я хочу читать 128...