У меня 37 лет файлов NetCDF с ежедневным шагом по времени и вычислением функции для каждой ячейки за все годы (13513 дней).Вычисление этой функции повторяется для всех ячеек.Для этого я использую xarray
и da.sel
, но он очень медленный и не использует несколько ядер моего ноутбука.Я изо всех сил пытаюсь понять, как использовать dask в текущем сценарии.Любые предложения по улучшению / ускорению кода?
for c in range(len(df)):
arr = np.array([])
lon=df.X[c]
lat=df.Y[c]
for yr in range(1979,2016,1):
ds = xr.open_dataset('D:/pr_'+str(yr)+'.nc')
da = ds.var.sel(lon=lon, lat=lat, method='nearest')
arr = np.concatenate([arr, da])
fun = function(arr)