NVIDIA не предоставляет никакой информации о том, как устройства работают на этом уровне. Существует инструмент под названием decuda, который может декомпилировать кубины, чтобы вы могли видеть машинный код. Насколько я помню, немедленные переходят в поток инструкций, по крайней мере, насколько способен выводить декуда. Проблема с decuda заключается в том, что он работает только для CUDA 2.3 или ниже. Они изменили формат исполняемого файла на elf в CUDA 3.0, и decuda не поддерживалась долгое время.
Лучшей официальной документацией является документация PTX , но она документирует виртуальную машину, а не реальное устройство.