Количество активных деформаций в GPU (Fermi) - PullRequest
0 голосов
/ 13 июля 2011

У меня есть быстрый вопрос об активных деформациях в GPU (я бы предпочел знать это в Fermi).Для конкретного ядра число активных деформаций в любом цикле в SM одинаково для всего времени выполнения ядра?Как я экспериментировал, существует некоторая корреляция между общим количеством активных деформаций (для всего выполнения) и количеством синхронизаций в ядре программы.Кто-нибудь может прояснить это отношение?Спасибо

Ответы [ 2 ]

3 голосов
/ 13 июля 2011

Количество активных деформаций может изменяться со временем, так как:

  • Другие блоки потоков могут завершаться или начинаться на одном и том же SM, поэтому, если у вас есть четыре деформации на один блок потока, то если только один блок потока находится наSM у вас будет до четырех деформаций, но с двумя или тремя блоками потоков у вас будет до восьми или двенадцати соответственно.
  • Если деформация достигает конца своего кода, то он больше не будет выполнять код (естественно)

Количество активных деформаций для выполнения всей программы будет зависеть от ряда факторов, но помните, что оно увеличивается на количество активных деформаций в каждом цикле.Это означает, что если вы увеличите количество синхронизаций, что также увеличит количество циклов, необходимых каждой деформации для выполнения ядра, тогда вы ожидаете более высокое число активных деформаций.

Также обратите внимание, что некоторые производные статистические данные вПрофилировщики являются приблизительными, так как они часто используют значения из более чем одного прогона, следовательно, может быть некоторая изменчивость.

0 голосов
/ 14 июля 2011

Взаимосвязь между синхронизацией барьера и переносом объясняется в этой статье Демистификация микроархитектуры графического процессора с помощью микробенчмаркинга .

...