В общем, ответ на ваш вопрос "да", магазины похожи на нагрузки.Разница в том, что поскольку хранилища «запускаются и забываются», если есть работа, которая не зависит от сохраненных адресов, то она может быть немедленно запущена мультипроцессором (-ами) после выдачи хранилищ, и остановка будет происходить только тогда, когдавстречаются зависимости чтения после записи.
Для получения полной информации я предлагаю прочитать раздел 5.3.2 самого последнего Руководства по программированию CUDA .
Также см. Приложение F к этому документу для конкретной информации, относящейся к разным семействам архитектур.Например, вычислительные возможности 1.x имеют больше «обрывов» производительности, чем вычислительные возможности устройств 2.x (Fermi).