Вы не можете предсказать, как будут обрабатываться потоки внутри ядра.Вы можете только гарантировать, что внутри рабочей группы потоки будут работать более или менее синхронно, и вы можете использовать барьеры.
Если вам нужна какая-то синхронизация внутри ВСЕХ ваших потоков.Возможно, пришло время иметь 2 отдельных ядра или полностью изменить способ кодирования вашего ядра.