Каковы измеренные значения задержки иерархии памяти в примере устройства с поддержкой CUDA? - PullRequest
1 голос
/ 09 декабря 2011

Несмотря на то, что этот вопрос похож на мой, опубликованных значений задержки для различных типов до сих пор нет. Я был бы признателен за фактические измерения и объяснение методов и обоснования их подхода. Подойдет любая дискретная карта NVidia с поддержкой CUDA.

Вещи для измерения:

  1. Регистрация

  2. Общая память

  3. Постоянное попадание в кэш

  4. Память устройства

  5. Глобальная память

1 Ответ

3 голосов
/ 10 декабря 2011

Эта статья в значительной степени является примером сравнительного анализа золотого стандарта для графического процессора CUDA.Он предоставляет большую часть информации, которая вас интересует, благодаря очень тщательному микро-бенчмаркингу с использованием графического процессора Tesla C1060 / GTX 285 "GT200" класса.

...