Question

Предположим, я объявляю локальную переменную в функции ядра CUDA для каждого потока:

float f = ...; // some calculations here

Предположим также, что объявленная переменная была помещена компилятором в локальную память (которая совпадает сглобальный за исключением того, что он виден только для одного потока, насколько я знаю).Мой вопрос: будет ли доступ к f слияния при его чтении?

talonmies · Answer 1 · 06 сентября 2011

Я не верю, что есть официальная документация о том, как локальная память (или стек в Fermi) размещается в памяти, но я почти уверен, что доступ к мультипроцессорному доступу осуществляется «чередующимся» образом, чтобы не расходящиеся потокив этом же варпе получится объединенный доступ к локальной памяти.В Fermi локальная память также кэшируется с использованием того же механизма доступа L1 / L2, что и глобальная память.

John Gordon · Answer 2 · 22 сентября 2011

На картах CUDA нет памяти, выделенной для локальных переменных.Все локальные переменные хранятся в регистрах.Сложные ядра с большим количеством переменных уменьшают количество потоков, которые могут работать одновременно, условие, известное как низкая занятость.

Доступ к локальной памяти объединен?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Доступ к локальной памяти объединен?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы