Зависит от того, как вы возвращаете логическое значение обратно в CPU.
вы используете cudaMemcpy?
если да, то вам не нужно использовать cudaDeviceSynchronize (), поскольку cudaMemcpy будет блокировать, пока ядро не завершит выполнение, а затем скопирует данные из GPU в CPU.