Параллельная аппликация функции на цепочках теноров питора - PullRequest
0 голосов
/ 26 июня 2018

Мне нужно применить пользовательскую функцию ко всем строкам тензора cuda. Из-за того, что эта функция занимает очень мало ресурсов графического процессора, но значительное время я хочу ускорить вычисления, применяя эту функцию к нескольким строкам одновременно. Расчет для другой строки может занять значительно разное время. Какой самый эффективный способ сделать это?

...