Максимальный размер программы CUDA - PullRequest
0 голосов
/ 11 марта 2019

Я не нашел никаких сведений о максимальном размере источника CUDA PTX или скорости его выполнения.

Идея состоит в том, чтобы программа перезаписывала большой блок кода сборки PTX, который содержит набор данных для очень быстрого доступа к регистру и не извлекает данные из глобальной памяти во время своих функций. Таким образом, ваш набор данных становится предустановленным в исходный код PTX.

1 Ответ

0 голосов
/ 11 марта 2019

Приложение A руководства по программированию ссылается на 2 миллиона инструкций ptx на ядро ​​(это из чата на форуме 2010 года - я не нашел прямой ссылки), так что imho его определенно выполнимо и без требования доступа к глобальной памяти ускорения могут быть драматичным ..

...