Я думаю, что AMD CodeXL - это то, что вы ищете. Это бесплатный набор инструментов, который содержит отладчик OpenCL и профилировщик графического процессора.
Отладчик OpenCL позволяет выполнять построчную отладку ваших ядер OpenCL и кода хоста, просматривать все переменные в разных рабочих группах, просматривать специальные события и ошибки, которые происходят, и т.
Профилировщик GPU имеет приятную функцию, которая генерирует временную шкалу, показывающую, как долго ваша программа тратит на такие задачи, как передача данных и выполнение ядра.
Для получения дополнительной информации и ссылок для скачивания, проверьте http://developer.amd.com/tools-and-sdks/heterogeneous-computing/codexl/