Несмотря на то, что этот вопрос похож на мой, опубликованных значений задержки для различных типов до сих пор нет. Я был бы признателен за фактические измерения и объяснение методов и обоснования их подхода. Подойдет любая дискретная карта NVidia с поддержкой CUDA.
Вещи для измерения:
Регистрация
Общая память
Постоянное попадание в кэш
Память устройства
Глобальная память