В контексте графических процессоров SIMD представляет собой тип аппаратной архитектуры, в которой выполняются одновременные (параллельные) вычисления (выполнение инструкции), но только один процесс (инструкция) в данный момент.
Схематично, SIMD-архитектура может быть нарисована следующим образом:
(кредит для Википедии: https://en.wikipedia.org/wiki/SIMD)
Пул данныхв нашем контексте это память GPU, а PU - это процессор или исполнительный модуль (ядро Cuda в терминах GPU от NVidia). Итог - одно ядро GPU может одновременно выполнять одну и ту же инструкцию над разными данными.