Учитывая, что вам не нужны данные из смежных потоков, похоже, что было бы быстрее не беспокоиться о нескольких проходах рендеринга и избежать вызовов отрисовки, синхронизации и растеризации.
Тем не менее, если вашЦикл большой, общие вычисления сильно меняются во времени, или у вас недостаточно фрагментных шейдеров, работающих для того, чтобы поддерживать занятость графического процессора, это может ухудшить производительность.,Как вы уже делаете, тестирование обоих, вероятно, лучше всего.Было бы интересно увидеть разницу, когда вы меняете количество проходов и фрагментов.