Как ускорить logsumexp на большой тензор в NumPy? - PullRequest
0 голосов
/ 09 января 2019

У меня есть следующая операция в python на очень больших тензорах.

# p: 10000x1
# T,W: 400x400x10000
# Kp: 400x400
T = np.tile(p, (n, n, 1))
Kp = np.triu(scipy.special.logsumexp(T + W, axis=-1), k=1)

Я знаю, что могу использовать графический процессор и значительно ускорить процесс с помощью logsumexp PyTorch, но сейчас я хотел бы попытаться оптимизировать версию с привязкой к процессору.

...