Гумеров смог ускорить FMM для потенциала Лапласа до ~ 70x. Вы можете прочитать его превосходную статью здесь (pdf) .
Однако такие результаты обычно довольно бессмысленны. Например, Intel Core i7 980 XE оценивается в 109GFLOPS, тогда как Nvidia GTX 480 достигает 672 GFLOPS. Если обе архитектуры используются полностью, максимальное достижимое ускорение будет примерно в 6 раз. Конечно, для определенных проблем легко получить высокую загрузку на GPU, но сильно на CPU.