Могу ли я предварительно выбирать конкретные данные для определенного уровня кэша в ядре CUDA? - PullRequest
7 голосов
/ 21 января 2011

Я понимаю, что графические процессоры Fermi поддерживают предварительную выборку в кэш L1 или L2. Однако в справочном руководстве CUDA я ничего не могу найти по этому поводу.

Сборы CUDA позволяют моему коду ядра предварительно выбирать конкретные данные для определенного уровня кэша?

1 Ответ

6 голосов
/ 10 февраля 2011

Ну, не на уровне инструкций, а подробная информация о предварительной загрузке в графических процессорах здесь:

Многопоточные механизмы предварительной выборки для приложений GPGPU
(статья в симпозиуме ACM по микроархитектуре 2010)

Ссылку на инструкцию можно найти в документе nVIDIA PTX ISA ; соответствующие инструкции: prefetch и prefetchu.

...