Мне было интересно, существует ли стандартный способ программного определения количества максимально одновременных рабочих групп, которые могут работать на графическом процессоре.
Например, на карте NVIDIA с 5 вычислительными блоками (или SM) может быть максимум 8 рабочих групп (или блоков) на вычислительную единицу, поэтому максимальное количество рабочих групп, которые могут быть запущены одновременно, равно 40.
Поскольку с помощью clGetDeviceInfo
я могу найти количество вычислительных блоков, все, что мне нужно, - это максимальное количество рабочих групп, которое можно запустить на вычислительной единице.
Спасибо!