Проблема производительности Cuda - PullRequest
1 голос
/ 08 марта 2011

возможно, этот вопрос слишком общий, но, возможно, у кого-то есть такая же проблема.

У меня есть небольшая программа cuda, использующая тягу, и все в порядке. Работает как положено.

Но когда я переношу ту же программу на другую машину, производительность всей программы будет примерно в 10-100 раз ниже, чем на исходной машине. Аппаратное обеспечение второй машины должно быть быстрее (GTX480 вместо GTX265), так что я думаю, проблема в самой второй машине. У кого-нибудь есть идеи, что может пойти не так?

1 Ответ

1 голос
/ 08 марта 2011

Да, --arch = sm_20 решил проблему.

...