Если поток блокируется, планировщик операционной системы должен автоматически переключиться на другой выполняемый поток (если он доступен), поэтому вам не нужно ничего делать.
Однако, если вся ваша программа OpenMP работаетВ этом случае вызывается ядро CUDA. Вероятно, что узким местом является графический процессор, так что вы все равно не получите большой пользы от использования потоков на процессоре.Возможно, не стоит использовать OpenMP вообще.
Если вы продолжаете использовать OpenMP, вам, вероятно, следует добавить collapse(2)
к этому omp parallel for
.