Сроки параллельных ядер CUDA - PullRequest
2 голосов
/ 02 февраля 2011

К сожалению, графические процессоры на основе Fermi будут отслеживать любую синхронизацию ядра как сериализованную в Parallel Nsight, даже если они являются параллельными ядрами в разных потоках.

Может кто-нибудь подсказать, как показать параллельность ядер в разных потоках вручную, используя таймеры.

Cheers Ed

1 Ответ

2 голосов
/ 04 февраля 2011

Профилирование с помощью Nsight в настоящее время отключает параллельные ядра, поэтому для получения точного времени вам необходимо использовать события для отслеживания времени.

Вы можете использовать события, как вы ожидаете, и вы можете использовать cudaStreamWaitEvent(), чтобы заставить поток ожидать событие в другом потоке. Для получения дополнительной информации см. Справочное руководство CUDA , раздел 4.5.2.5.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...