Пакетный точечный продукт на основе Python GPU - PullRequest
1 голос
/ 26 апреля 2019

У меня есть два разных больших массива numpy, почти (200k на 5k) и (5k на 150k) (они не являются предопределенными массивами в некоторых файлах, я должен извлечь их в соответствии с некоторыми алгоритмами).Мне нужно рассчитать их точечное произведение.Вычисление точечного произведения с использованием np.dot на CPU очень медленное, также у меня есть 4 ГБ GPU, поэтому они не подходят для GPU.Мне было интересно, есть ли какое-нибудь простое решение в Python для вычисления точечного продукта (пакетного) в GPU?

Я перепробовал множество решений и тем.Например, различные функции matmul из numba дают неправильные ответы.https://numba.pydata.org/numba-doc/dev/cuda/examples.html http://jiajiamomomo.blogspot.com/2017/04/running-numba-example-of-matrix.html

Я использую numpy 1.16 в ОС Windows.Согласно результату np.show_config() он имеет поддержку mkl.

...