возможно, этот вопрос слишком общий, но, возможно, у кого-то есть такая же проблема.
У меня есть небольшая программа cuda, использующая тягу, и все в порядке. Работает как положено.
Но когда я переношу ту же программу на другую машину, производительность всей программы будет примерно в 10-100 раз ниже, чем на исходной машине. Аппаратное обеспечение второй машины должно быть быстрее (GTX480 вместо GTX265), так что я думаю, проблема в самой второй машине. У кого-нибудь есть идеи, что может пойти не так?