вот что я нашел: «Ядра выполняют только арифметику с плавающей запятой одинарной точности. Существует 1 единица с плавающей запятой двойной точности».
верно ли это для всех вычислительных возможностей (версий)?
Точность и производительность с плавающей запятой одинарной и двойной точности постоянно меняются и различаются для каждой вычислительной возможности.
http://developer.download.nvidia.com/assets/cuda/files/NVIDIA-CUDA-Floating-Point.pdf
http://developer.download.nvidia.com/compute/DevZone/docs/html/C/doc/CUDA_C_Programming_Guide.pdf
раздел 5.4.1, таблица 5-1.