Атомарные операции поддерживаются не всеми поколениями графических процессоров, и целью nvcc по умолчанию является sm_10. Предполагая, что ваш графический процессор поддерживает элементарные операции (подробности о том, какие функции поддерживаются вашим графическим процессором, см. В CUDA C Guide , приложение F.1), вам потребуется целевая архитектура, например, -gencode arch=compute_20,code=\'compute_20,sm_20\'
для Ферми и новее. См. Руководство NVCC для получения дополнительной информации о параметрах gencode.
Кстати, действительно ли добавление флага --ptxas-options=-v
меняет поведение? Если нет, то название вашего вопроса вводит в заблуждение.