Есть ли что-то вроде Hadoop, но основанное на GPU?Я хотел бы сделать некоторые исследования в...
GeForce GTX 560 Ti имеет 8 SM, а каждый SM имеет 48 ядер cuda (SP).Я собираюсь запустить ядро...
Является ли использование cudaDeviceReset () после вычислений нормальным способом использования...
Я не понимаю, почему приведенный ниже простой код не работает при c [0] = d void test(char **a){...
Я действительно не понимаю, почему вывод для кода ниже не a и b. #include<cutil.h>...
Ниже приведена небольшая программа, которую я написал, чтобы увидеть, как могут возникнуть условия...
Я реализовал алгоритм, который использовал сортировку. Я попробовал Thrust :: sort_by_key, который...
Возможно ли повысить производительность, запустив графический процессор для алгоритма со следующими...
Я пытаюсь запустить свой собственный пример с несколькими графическими процессорами и следую...
Я новичок в нескольких графических процессорах.Я написал код для одного графического процессора и...
Хорошо, это будет глоток. У меня есть указатель на сериализованный 2D-массив, кроме арифметики с...
Я знаю, что «Максимальный объем разделяемой памяти на мультипроцессор» для GPU с Compute Capability...
У меня есть программа, ссылающаяся на cuda, cublas и cudart. Есть ли способ развернуть ее, не...
Это концептуальный вопрос в отношении программирования. Подводя итог, у меня есть два массива /...
Предположим, я хочу выполнить асинхронный хост memcpy для устройства в CUDA, а затем немедленно...
Я собираюсь распараллелить на CUDA алгоритм локального поиска для некоторой задачи оптимизации....
Еще один вопрос, связанный с пропускной способностью.Я ожидал, что графики пропускной способности...
Я работаю над алгоритмом, который много раз выполняет одну и ту же операцию. Поскольку операция...
Является ли плохой идеей поместить цикл в ядро? или это обычное дело?
Почему эта матрица транспонирует ядро быстрее, когда массив разделяемой памяти дополняется одним...
Я использовал тот же график, что и прилагается, для другого вопроса. Видно, что максимальная...
Есть ли способ сделать это в CUDA + C ++ ?? класс: 1 class1 { __device__ ....//some cuda code void...
В настоящее время я пишу автоматизированную систему контроля, которая использует масштабное...
Мне интересно, освобождается ли кэш L2 между несколькими вызовами ядра.Например, у меня есть ядро,...
Когда я анализирую свое ядро, следующие кнопки отображаются серым цветом при анализе уровня ядра:...