Класс набора данных Geoviews занимает слишком много времени для сетки xarray среднего размера - PullRequest
0 голосов
/ 14 мая 2019

Я пытаюсь построить сетку xarray, используя класс Geoviews Dataset.Данные имеют форму: (12,1300,1936) с координатами (месяцы, долгота, широта).

Создание экземпляра занимает слишком много времени (почти 7 часов в компьютере Ram i5 32 ГБ).Построение меньшего набора данных работает (занимает несколько секунд).

Это строковое представление xarray (с именем xmam):

<xarray.DataArray (MeanTemp Month:: 12, Latitude: 1300, Longitude: 1936)>
array([[[ nan,  nan, ...,  nan,  nan],
        [ 14.,  14., ...,  nan,  nan],
        ..., 
        [ nan,  nan, ...,  nan,  nan],
        [ nan,  nan, ...,  nan,  nan]],

       [[ nan,  nan, ...,  nan,  nan],
        [ 16.,  16., ...,  nan,  nan],
        ..., 
        [ nan,  nan, ...,  nan,  nan],
        [ nan,  nan, ...,  nan,  nan]],

       ..., 
       [[ nan,  nan, ...,  nan,  nan],
        [ 17.,  17., ...,  nan,  nan],
        ..., 
        [ nan,  nan, ...,  nan,  nan],
        [ nan,  nan, ...,  nan,  nan]],

       [[ nan,  nan, ...,  nan,  nan],
        [ 14.,  14., ...,  nan,  nan],
        ..., 
        [ nan,  nan, ...,  nan,  nan],
        [ nan,  nan, ...,  nan,  nan]]], dtype=float32)
Coordinates:
  * MeanTemp Month:  (MeanTemp Month:) |S9 'January' 'February' ... 'December'
  * Latitude         (Latitude) float64 25.57 25.56 25.55 ... 14.76 14.75 14.74
  * Longitude        (Longitude) float64 -103.6 -103.6 -103.6 ... -87.49 -87.48

Вот как я создаю экземпляр набора данных Geoviews

gvds = gv.Dataset(xmam,kdims=['Latitude', 'Longitude'],vdims=['MeanTemp Month:'],dynamic=True)

Я пробовал с параметром dynamic и без него, давая похожие результаты.

В чем, по-вашему, проблема?

Обратите внимание, что Datashader еще не играет никакой роли, потому что я просто создаю объект, даже не строю его!

1 Ответ

0 голосов
/ 14 мая 2019

Проблема была две:

  1. Как был построен xarray (xa).То есть аргумент dims ссылается на имя координат.Параметр coords (если это словарь) должен иметь то же имя, что и dim.

Рассмотрим следующий пример: Предположим, data - это комковатый наррар с формой (12 100 100)

coords_months = range(12)
coords_lon = np.linspace(-103,87,100)
coords_lat = np.linspace(14,25,100)
dims = ['months','longitude', 'latitude']
coords = {'months':coords_months,'latitude':coords_lat,'longitude':coords_lon }
xdata = xa.DataArray(data,coords=coords,dims=dims,name='MeanTemperature')
Как упоминалось philippjfr , объявление конструктора DataSet Geoviews (gv) было неправильным.

Вместо этого я использовал это:

gvds = gv.Dataset(xdata)

построение заняло немного времени (2 минуты).Однако я мог бы использовать метод regrid, определенный в:

from holoviews.operation.datashader import regrid
image = gvds.to(gv.Image,['Longitude','Latitude'],dynamic=True)
regrid(image)

, который работал отлично.

Другой связанный вопрос здесь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...