Могут ли функции NPP, более конкретные npps (https://docs.nvidia.com/cuda/npp/group__npps.html) быть вызваны как функция устройства?
Если я создаю глобальную функцию, могу ли я вызывать функции npps как nppsMaxIndx_32f
(для вычисления maxвектора)?
Пример: у меня 100 векторов по 10000 с плавающей запятой каждый, если я делаю это в коде хоста, мне нужно сделать 100 вызовов функции npp
Если я создаю глобальную функциюиз 100 потоков и внутри вызывают функцию npp для каждого вектора, чтобы они запускались одновременно, это будет работать? nppsMaxIndx_32f
можно назвать функцией устройства?
Я пробовал, кажется, функции NPPбыть функциями хоста.
functions.cu(237): error: calling a __host__ function("nppsMaxIndx_32f") from a
__global__ function("computeMax") is notallowed
functions.cu(237): error: identifier "nppsMaxIndx_32f" is undefined in device code
Однако выполнение вызова в коде хоста без синхронизации потоков вызовет их почти одновременно, не дожидаясь завершения предыдущего, но это можно сделать, только если вам не нужнопредыдущие данные для расчета.