Руководство по программированию CUDA C описывает архитектуру мультипроцессора.В документе говорится, что каждый мультипроцессор Fermi имеет два планировщика деформации.Я предполагаю, что кэш L2 разделен для одновременного кэширования.
Я не видел пропусков чтения L2 для архитектуры Kepler, но мультипроцессоры Kepler имеют четыре процессора деформации.Таким образом, это предположение может быть подтверждено, если для компиляции Kepler было указано четыре счетчика производительности.