Вопросы с тегом ptx - PullRequest

Вопросы с тегом ptx

1 голос
1 ответ

Я использую clang для генерации IR LLVM для ядер Nvidia OpenCL и Cuda, которые я хочу впоследствии...

0x6K5 / 01 ноября 2019
0 голосов
2 ответов

Я пытаюсь скомпилировать CUDA с помощью clang , но код, который я пытаюсь скомпилировать, зависит...

Increasingly Idiotic / 11 октября 2019
0 голосов
1 ответ

Пытаюсь сделать простой код, который добавит V1 (вектор) с V2 и сохранит значение в V3. Это работа...

Piotr Pluta / 23 июня 2019
0 голосов
2 ответов

Я строю проект с кодом CUDA, используя последний CMake, который имеет встроенную поддержку CUDA...

einpoklum / 05 мая 2019
0 голосов
1 ответ

Насколько я понимаю, CUDA 10.1 удалила инструкции shfl: PTX ISA версии 6.4 удаляет следующие...

Blizzard / 30 апреля 2019
0 голосов
1 ответ

Я не нашел никаких сведений о максимальном размере источника CUDA PTX или скорости его выполнения....

user794667 / 11 марта 2019
0 голосов
1 ответ

Я хочу поднять x до степени y в ptx. У Nvidia есть функция ex2 , которая вычисляет 2 ^ x и lg2 ,...

Volz / 13 января 2019
0 голосов
1 ответ

при компиляции файла cuda: nvcc -arch=sm_61 -std=c++11 -Xptxas -v,-warn-spills --use_fast_math...

Isaac / 13 сентября 2018
0 голосов
0 ответов

Очень простая функция cuda __device__ __device__ __noinline__ int add(int a, int b) { return a + b;...

Vladimir Nazarenko / 05 июля 2018
0 голосов
0 ответов

Предположим, у меня есть простой загрузчик, выполняющий некоторые инструкции x86, и я хочу иметь...

MazeOfEncryption / 09 июня 2018
0 голосов
1 ответ

В CUDA, как я могу определить, была ли моя последняя целочисленная арифметическая операция...

einpoklum / 30 мая 2018
7 голосов
1 ответ

Рекомендуете ли вы прочитать PTX-код вашего ядра, чтобы узнать, как оптимизировать ваши ядра? Один...

Framester / 10 ноября 2011
0 голосов
1 ответ

Предположим, у меня есть код, который позволяет пользователю передать threads_per_block для вызова...

tim / 18 мая 2011
7 голосов
1 ответ

Я понимаю, что графические процессоры Fermi поддерживают предварительную выборку в кэш L1 или L2....

dalibocai / 21 января 2011
7 голосов
2 ответов

Я хочу использовать ассемблерный код в коде CUDA C, чтобы сократить дорогостоящие исполнения, как...

superscalar / 09 сентября 2010
Для получения более полной информации посмотрите в списке вопросов или в популярных тегах.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...