Порядок исполнения металлических резьбовых групп - PullRequest
1 голос
/ 14 апреля 2019

Я пытаюсь использовать металл для реализации аппаратно-ускоренного фильтра изображений (вырезание шва для всех, кто заинтересован). Один шаг включает выполнение кода строка за строкой, с вычислениями для каждой строки в зависимости от вычислений в вышеупомянутой строке. Однако расчеты для каждой строки могут быть распараллелены по пикселям.

Один из подходов состоит в том, чтобы планировать ядро ​​один раз для каждой строки, но я уверен, что есть лучший способ сделать это, так как это приведет к большим накладным расходам.

Есть ли какой-нибудь способ сообщить Металлу, в каком порядке выполнять группы потоков?

...