Параллельное выполнение ядер для измерения времени выполнения
Я новичок в OpenCL. Я хочу измерить время выполнения ядра без использования clGetEventProfilingInfo
API. Два ядра, kernel_computation и kernel_counter ; kernel_computation предназначено для реальных вычислительных целей, а kernel_counter предназначено для подсчета тактов, необходимых для kernel_computation .
Точки нужно помнить
- Время их начала и окончания исполнения будет точным;они начинаются одновременно и также заканчиваются вместе.
- Я хочу, чтобы счетчик выходных данных был kernel_counter , когда kernel_computation заканчивает свое выполнение.
Если я использую CL_QUEUE_OUT_OF_ORDER_EXEC_MODE_ENABLE
при создании очереди команд, во время выполнения kernel_computation и kernel_counter начнут выполнение одновременно или нет? И их время окончания? Как я могу контролировать время их окончания?
Мое устройство
Плата Xilinx VCU-1525
Среда разработки
SDAccel
Благодарим вас за помощь,Заранее спасибо.