Вопросы с тегом ptx

3 голосов

1 ответ

В asm volatile встроенные инструкции PTX, зачем также указывать побочные эффекты "памяти"?

einpoklum / 29 апреля 2020

0 голосов

1 ответ

Почему этот NVIDIA CUDA PTX работает не так, как задумано?

Saitama10000 / 11 апреля 2020

0 голосов

1 ответ

Различия между NV CC и NVRT C при компиляции в PTX

Dinei / 01 апреля 2020

1 голос

1 ответ

Когда полезна (вариант по умолчанию) инструкция PTX `prmt`?

einpoklum / 17 февраля 2020

0 голосов

1 ответ

ptxas жалуется на (печатает) мою печальную функцию устройства

einpoklum / 16 февраля 2020

1 голос

1 ответ

LLVM IR ядра OpenCL для PTX в двоичный файл

Я использую clang для генерации IR LLVM для ядер Nvidia OpenCL и Cuda, которые я хочу впоследствии...

0x6K5 / 01 ноября 2019

0 голосов

2 ответов

Как передать флаги компилятора в nvcc из clang

Я пытаюсь скомпилировать CUDA с помощью clang , но код, который я пытаюсь скомпилировать, зависит...

Increasingly Idiotic / 11 октября 2019

0 голосов

1 ответ

Простое добавление векторов в Inline PTX CUDA

Пытаюсь сделать простой код, который добавит V1 (вектор) с V2 и сохранит значение в V3. Это работа...

Piotr Pluta / 23 июня 2019

0 голосов

2 ответов

Как я должен заставить CMake также создавать файлы PTX для моих ядер

Я строю проект с кодом CUDA, используя последний CMake, который имеет встроенную поддержку CUDA...

einpoklum / 05 мая 2019

0 голосов

1 ответ

Как правильно поддерживать инструкции `__shfl ()` и `__shfl_sync ()`?

Насколько я понимаю, CUDA 10.1 удалила инструкции shfl: PTX ISA версии 6.4 удаляет следующие...

Blizzard / 30 апреля 2019

0 голосов

1 ответ

Максимальный размер программы CUDA

Я не нашел никаких сведений о максимальном размере источника CUDA PTX или скорости его выполнения....

user794667 / 11 марта 2019

0 голосов

2 ответов

Что я могу использовать вместо инструкций LOP3 для работы с типами данных uint64_t и выполнять 3 операндных логических операции, используя одну инструкцию?

Я работаю над проектом, и мне нужно сделать 3 операнда логической операции с типами данных uint64_t

arm / 23 февраля 2019

0 голосов

1 ответ

Поднимите x на степень y в ptx nvidia cuda (сборка)

Я хочу поднять x до степени y в ptx. У Nvidia есть функция ex2 , которая вычисляет 2 ^ x и lg2 ,...

Volz / 13 января 2019

0 голосов

1 ответ

как интерпретировать имена ptx функций

при компиляции файла cuda: nvcc -arch=sm_61 -std=c++11 -Xptxas -v,-warn-spills --use_fast_math...

Isaac / 13 сентября 2018

0 голосов

0 ответов

Почему CUDA получает и возвращает параметры int через регистры .b32 или .u32

Очень простая функция cuda __device__ __device__ __noinline__ int add(int a, int b) { return a + b;...

Vladimir Nazarenko / 05 июля 2018

0 голосов

0 ответов

Как я могу использовать PTX-код NVIDIA для рисования графики на экране?

Предположим, у меня есть простой загрузчик, выполняющий некоторые инструкции x86, и я хочу иметь...

MazeOfEncryption / 09 июня 2018

0 голосов

1 ответ

Как проверить переполнение целочисленной арифметики в CUDA?

В CUDA, как я могу определить, была ли моя последняя целочисленная арифметическая операция...

einpoklum / 30 мая 2018

7 голосов

1 ответ

Стоит ли искать PTX для оптимизации моего ядра?Если так, то как?

Рекомендуете ли вы прочитать PTX-код вашего ядра, чтобы узнать, как оптимизировать ваши ядра? Один...

Framester / 10 ноября 2011

0 голосов

1 ответ

Свойства устройства CUDA и возможности вычислений при компиляции

Предположим, у меня есть код, который позволяет пользователю передать threads_per_block для вызова...

tim / 18 мая 2011

7 голосов

1 ответ

Могу ли я предварительно выбирать конкретные данные для определенного уровня кэша в ядре CUDA?

Я понимаю, что графические процессоры Fermi поддерживают предварительную выборку в кэш L1 или L2....

dalibocai / 21 января 2011

7 голосов

2 ответов

Можно ли поместить инструкции по сборке в код CUDA?

Я хочу использовать ассемблерный код в коде CUDA C, чтобы сократить дорогостоящие исполнения, как...

superscalar / 09 сентября 2010