CUDA, ограничение общей памяти на карте CC 2.0 - PullRequest
2 голосов
/ 12 августа 2011

Я знаю, что «Максимальный объем разделяемой памяти на мультипроцессор» для GPU с Compute Capability 2.0 составляет 48 КБ, как сказано в руководстве.

Я немного озадачен количеством общей памяти, которую я могу использовать для каждого блока?Сколько блоков в мультипроцессоре.Я использую GeForce GTX 580.

1 Ответ

4 голосов
/ 12 августа 2011

В Fermi вы можете использовать до 16 КБ или 48 КБ (в зависимости от выбранной конфигурации) разделяемой памяти на блок - количество блоков, которые будут одновременно выполняться на многопроцессорном устройстве, определяется объемом общей памяти и регистрацией каждого блока требуется максимум до 8. Если вы используете 48 КБ, то одновременно может работать только один блок. Если вы используете 1 КБ на блок, то в зависимости от использования их регистров одновременно может работать до 8 блоков на каждый мультипроцессор.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...