Я пытаюсь распараллелить написанную мной функцию Python для одновременной работы на нескольких ядрах графического процессора, но похоже, что современные методы для этого, такие как векторизация и guvectorize из numba, не допускают ничего более изощренного, чем простоеарифметические операции в функции (https://github.com/numba/numba/issues/2736).
Мой вопрос заключается в том, существует ли пакет или метод, отличный от numba, способный обрабатывать функции, вызывающие функции numpy, такие как numpy.where или numpy.intersect1d?
Абсолютно новичок в программировании на GPU и не уверен, каковы современные возможности, поэтому извините, если этот вопрос кажется глупым.
Большое спасибо!