NVidia CUDA: разница между процессорами Tesla T10 и процессором Tesla M2090 - PullRequest
1 голос
/ 28 июня 2011

У меня есть код CUDA, который выполняет вычисления с конечной разностью. Код хорошо работает на процессорах Tesla M2090 без ошибок. Тот же код приводит к большому количеству ошибок в процессоре Tesla T10. Я получаю много нулей в моих результатах.

Кто-нибудь знает разницу между этими двумя архитектурами и решением того, как решить проблему

1 Ответ

5 голосов
/ 28 июня 2011

Tesla C1060 (на основе Tesla T10) обладает вычислительными возможностями. 1.3 Tesla M2090 - это гораздо более новая архитектура, основанная на Fermi (2.0 или 2.1). Возможны две проблемы:

Перекомпилируйте ли вы исходный код для 2.0или 2.1 архитектура?Если вы компилируете для архитектуры 1.3, она не будет работать для> = 2.0.

Руководство по программированию CUDA 3.1.2 Двоичная совместимость:

Двоичная совместимость гарантируется с одной незначительной ревизии доследующий, но не от одной незначительной ревизии к предыдущей или через основные ревизии.

Кроме того, Ферми ведет себя немного по-другому.Некоторый небезопасный код может корректно работать на старых архитектурах, в то время как на Fermi он улавливает ошибку.Если вы подозреваете это, вы можете проверить «Руководство по совместимости Fermi» (доступно с инструментарием CUDA), чтобы узнать об основных различиях между архитектурами с точки зрения программиста.

...