Scipy RBF интерполяция на моем linux vps - PullRequest
0 голосов
/ 30 апреля 2019

У меня ~ 2400 точек (x, y, T) и я хочу интерполировать их в сетку 261 x 157 путем RBF-интерполяции.С dask операция выполняется на моем ноутбуке с Windows.Тем не менее, тот же код с теми же данными работает очень медленно на моем Ubuntu VPS, который имеет аналогичную вычислительную мощность с моим ноутбуком.

# input: xp, yp, t, xx, yy
import dask.array as da

chunks = 1, xx.shape[1]
rbf = Rbf(xp, yp, t, function='linear') # ~1.5s on my laptop, ~35s on my vps
x_dask = da.from_array(xx, chunks=chunks)
y_dask = da.from_array(yy, chunks=chunks)
t_dask = da.map_blocks(rbf, x_dask, y_dask)
self.data = t_dask.compute() # ~3.7s on my laptop, >10 min on my vps!

numpy на моем ноутбуке связан с MKL и связаноткрыть openbps на vps (pip установлен).Я также попытался установить conda numpy, который связан с MKL на VPS без заметного улучшения.Я также запускаю бенчмарк из здесь , чтобы увидеть, действительно ли разница настолько велика, но они дают похожий результат:

==Laptop
Dotted two 2048x2048 matrices in 0.80 s.
Dotted two vectors of length 262144 in 0.25 ms.
SVD of a 1024x512 matrix in 0.28 s.
Cholesky decomposition of a 1024x1024 matrix in 0.06 s.
Eigendecomposition of a 1024x1024 matrix in 2.58 s.

==Ubuntu, pip
Dotted two 2048x2048 matrices in 0.82 s.
Dotted two vectors of length 262144 in 0.14 ms.
SVD of a 1024x512 matrix in 0.37 s.
Cholesky decomposition of a 1024x1024 matrix in 0.04 s.
Eigendecomposition of a 1024x1024 matrix in 2.55 s.

==Ubuntu, conda
Dotted two 2048x2048 matrices in 0.65 s.
Dotted two vectors of length 262144 in 0.20 ms.
SVD of a 1024x512 matrix in 0.29 s.
Cholesky decomposition of a 1024x1024 matrix in 0.06 s.
Eigendecomposition of a 1024x1024 matrix in 2.21 s.

Я уменьшил количество баллов до 100 и rbf наVPS по-прежнему примерно в 180 раз медленнее.Я также пытался удалить часть dask из своего кода, но ничего не изменилось.

Так что теперь я понятия не имею, что произошло и как это исправить.numpy и scipy на моем ноутбуке загружаются с Кристоф Гольке , есть ли у скомпилированных бинарных файлов по этой ссылке какая-то специальная оптимизация, которая мне неизвестна?Спасибо за любые мысли!

...