Исходный код batchedgemm? - PullRequest
0 голосов
/ 28 февраля 2012

У меня особая проблема.

У меня есть некоторый исследовательский код, который я разработал для моего macbook с использованием CUDA 4.1, особенно с использованием batchedgemm.Теперь я должен запустить его на кластере графических процессоров, которые я одолжил в другом учреждении.

Моя проблема в том, что в кластере установлена ​​только CUDA 4.0, и они не хотят быстро обновляться.

Кто-нибудь знает, могу ли я где-нибудь взять исходный код batchedgemm и скомпилировать его для работы под 4.0?

Я написал свое собственное ядро ​​для выполнения пакетных умножений, но оно выполняет порядокпримерно на 10 медленнее библиотечного - я бы хотел стоять на плечах великих людей, а не на их пальцах.

1 Ответ

2 голосов
/ 29 февраля 2012

Я понимаю нежелание быстро обновлять производственный кластер.Многие кластеры используют систему модулей, что означает, что несколько версий инструментария CUDA могут сосуществовать.Драйвер, однако, необходимо обновить до версии, которая поддерживает последнюю используемую CUDA.Вот почему они не хотели бы, потому что им нужно было бы тестировать производственные коды и приложения своих пользователей, чтобы избежать регрессии или сбоев.

Поскольку CUBLAS не является открытым исходным кодом, я рекомендую вам попытаться разработать свой код отдельномашина, и если вы получаете большую скорость от пакетной, представьте это администраторам в качестве причины для обновления.

...