cublas cublasZgemm () медленнее, чем ожидалось - PullRequest
4 голосов
/ 04 марта 2012

По данным nvidia .cublasZgemm в 6 раз быстрее Intel MKL.

Однако на моем ПК (i7 2600, Nvidia gtx560, OS: linux 64bit) cublasZgemm немного медленнее, чем MKL.

Я использую numpy.dot (), поставляемая с enthought python дистрибутивом , который связывает numy с MKL 10.3.

Функция умножения матриц с использованием cublasZgemm компилируется в разделяемой библиотеке и вызывается с использованием ctypes в скрипте python.

При умножении двух комплексных матриц 1024x1024.numpy.dot () занял 84мс.Вызов функции ctypes потратил 110 мс, в то время как функция cublasZgemm () заняла 97 мс.

Интересно, почему cublassZgemm не так быстр, как указано в nvidia?

1 Ответ

4 голосов
/ 05 марта 2012

Интересно, почему cublassZgemm не так быстр, как заявлено nvidia?

Короткий ответ: потому что вы использовали гораздо более медленный графический процессор для выполнения теста zgemm, чем NVIDIAгенерировать свои показатели производительности.Ваш GTX560, вероятно, примерно в в восемь раз медленнее в исполнении с двойной точностью, чем Telsa M2090, который использовался NVIDIA в вашей ссылке.

...