Я скачал tarball, на который вы ссылаетесь, сначала создав статическую библиотеку UtilNPP. Вам нужно будет отредактировать переменную CUDA_INSTALL_PATH, например, строки 45-47 define.mk в соответствующей директории:
#ifdef cuda-install
CUDA_INSTALL_PATH := /usr/global/cuda/4.1/cuda
#endif
Затем я написал / получил следующий сценарий сборки из каталога, содержащего исходный код:
module load cuda/4.1
shlib="-L/usr/global/cuda/4.1/cuda/lib64/ -lnpp"
inc="-I../../common/UtilNPP -I../../common/FreeImage/include -I../../../shared/inc -I/usr/global/cuda/4.1/cuda/include/"
stlib="../../common/lib/libUtilNPP_x86_64.a ../../common/FreeImage/lib/linux /libfreeimage64.a"
nvcc $inc $stlib $shlib boxFilterNPP.cpp -o foo.x
. / Foo.x работает нормально; вам, конечно, нужно будет изменить путь установки cuda в соответствии с вашей установкой, и если вы не используете модульную систему, убедитесь, что ваш LD_LIBRARY_PATH верен и т. д., и т. д., надеюсь, это поможет