Мне было интересно, что происходит, когда несколько потоков в одной деформации пытаются получить доступ к одному и тому же месту в глобальной памяти (например, к одному и тому же 4-байтовому слову), особенно в графических процессорах Turing с вычислительной возможностью 7.5. Я считаю, что в разделяемой памяти, которая может привести к конфликту банков, если все потоки не обращаются к одному и тому же месту, данные будут транслироваться.
Просто для того, чтобы придумать надуманный пример:
1) Учтите, что первые 16 потоков деформации обращаются к одному 4-байтовому слову, тогда как остальные 16 потоков обращаются к следующему 4-байтному. слово. Как осуществляется доступ в такой ситуации? Сериализован ли он для каждого потока в полу-деформации?
2) Что если вся деформация попытается получить доступ к одному 4-байтовому слову из глобальной памяти?