У меня есть вопрос о предикации веток в графических процессорах. Насколько я знаю, в графических процессорах они делают предикацию с ветками.
Например, у меня есть такой код:
if (C)
A
else
B
Итак, если A требуется 40 циклов, а B - 50 циклов, чтобы завершить выполнение, если предполагается, что для одной деформации выполняются и A, и B, то нужно ли всего 90 циклов для завершения этого перехода? Или они перекрывают A и B, то есть, когда выполняются некоторые инструкции A, затем ждут запроса памяти, затем выполняются некоторые инструкции B, затем ждут памяти и т. Д.?
Спасибо