Как указано в руководстве "Статистика филиала" , существует два показателя: эффективность филиала и эффективность потока управления.
Первый имеет аппаратный счетчик branch_efficiency
. Тем не менее, похоже, что для последнего нет прямого аппаратного счетчика. Можно ли найти соотношение выполненных и выданных команд потока управления и использовать его в качестве второго показателя эффективности? Или показатель использования потока управления cf_fu_utilization
?
Поскольку эффективность потока управления можно интерпретировать как число потоков, активных для одной инструкции в деформации, я думаю, что warp_execution_efficiency
также можно использовать, поскольку в определении указано
Отношение среднего количества активных потоков на деформацию к максимальному количеству потоков на деформацию, поддерживаемое в многопроцессорном компьютере
Любой комментарий по этому поводу?