Как рабочий набор ядра, например количество регистров, влияет на способность графических процессоров скрывать задержки памяти.
Путем распределения задержки поиска по группе параллельных потоков (деформация). Подробнее см. В Руководстве по программированию CUDA в CUDA SDK