Это в основном расширенный комментарий, так как @diego запрашивает обновления ...
Я установил CUDA 10.0, а панель управления nVidia сообщает о nvcuda.dll как v 10.0.132
Я создал рекомендованный демонстрационный файл devicequery.exe с использованием Visual Studio 2017 из решения vs в C: \ ProgramData \ NVIDIA Corporation \ CUDA Samples \ v10.0 \ 1_Utilities \ deviceQuery (обратите внимание, что файл .exe заканчивается в C: \ ProgramData \NVIDIA Corporation \ CUDA Samples \ v10.0 \ bin \ win64 \ Debug)
Затем программа запустилась из командной строки и выдала следующий вывод.
devicequery Запуск ...
Версия запроса устройства CUDA (API времени выполнения) (статическое связывание CUDART)
Обнаружено 1 устройство (-и), поддерживающее CUDA
Устройство 0: драйвер CUDA "GeForce GTX 1080 Ti"Версия / время выполнения Версия 10.0 / 10.0 CUDA Возможность Номер основной / вспомогательной версии: 6.1 Общий объем глобальной памяти: 11264 МБ (11811160064 байт) (28) Мультипроцессоры, (128) CUDA Cores / MP: 3584 CUDA Cores GPU Максимальная тактовая частота:
1607 МГц (1,61 ГГц) Тактовая частота памяти:
5505 МГц Ширина шины памяти: 352-битный Размер кэша L2: 2883584 байт Максимальный размер текстуры (x, y, z) 1D = (131072), 2D = (131072,65536), 3D = (16384, 16384, 16384) Максимальный размер многослойной текстуры, (num) слоев 1D = (32768), 2048 слоев Максимальный размер многослойной текстуры, (num) слоев 2D = (32768, 32768), 2048 слоевОбщий объем постоянной памяти: 65536 байт. Общий объем разделяемой памяти на блок: 49152 байта. Общее количество регистров, доступных на блок: 65536 Размер деформации:
32 Максимальное количество потоков в многопроцессорном режиме: 2048 Максимальное количество потоков в блоке: 1024Максимальный размерный размер блока резьбы (x, y, z): (1024, 1024, 64) Максимальный размерный размер размера сетки (x, y, z): (2147483647, 65535, 65535) Максимальный шаг памяти:
2147483647 байт. Выравнивание текстуры: 512 байт. Одновременное копирование и выполнение ядра: Да с двумя механизмами копирования. Ограничение времени работы на ядрах: Да.
Встроенный общий доступ к графическому процессору. Память хоста: Нет. ping: Да Требование выравнивания для поверхностей: Да Устройство имеет поддержку ECC:
Отключено Режим драйвера устройства CUDA (TCC или WDDM): WDDM (модель драйвера дисплея Windows) Устройство поддерживает унифицированную адресацию (UVA): Да Устройство поддерживает предварительную выгрузку: Нет
Поддерживает запуск кооперативного ядра: нет Поддерживает запуск многоядерного ядра кооператива: нет Идентификатор домена PCI устройства / идентификатор шины / идентификатор местоположения: 0/1/0 Режим вычисления: <по умолчанию (несколько потоков хоста могут использовать :: cudaSetDevice ()с устройством одновременно)>
deviceQuery, драйвер CUDA = CUDART, версия драйвера CUDA = 10.0, версия CUDA Runtime = 10.0, NumDevs = 1 Результат = PASS
Что я сделал сдостичь этого? Трудно быть конкретным, потому что я не осознавал, что мне это удалось, но я вспоминаю установку драйвера дисплея на VGA, перезагрузку (дважды для безопасности), затем удаление CUDA 10.0, перезагрузку и установку 10.0.
Я только что заметилчто я построил deviceQuery с решением vs 2012, но я согласился с обновлением VS для решения open.