Программы CUDA компилируются в набор команд PTX .Этот набор инструкций не содержит SIMD-инструкций.Таким образом, программы CUDA не могут явно использовать SIMD.
Однако вся идея CUDA заключается в том, чтобы делать SIMD в большом масштабе.Отдельные потоки являются частью групп, называемых перекосами, внутри которых каждый поток выполняет одну и ту же последовательность команд (хотя некоторые инструкции могут быть исключены для некоторых потоков, создавая иллюзию различных последовательностей выполнения).NVidia называет это Single Instruction, Multiple Thread (SIMT), но по сути это SIMD.