Добавьте измерение времени в набор данных xarray и назначьте ему координаты из другого набора данных - PullRequest
0 голосов
/ 12 июля 2020

У меня есть объект набора данных (импортированный из файла netCDF через xarray.open_dataset) с именем ds. Он содержит переменные с именами variable1 и latitude и longitude.

>>>ds
<xarray.Dataset>
Dimensions:    (latitude: 681, longitude: 841)
Coordinates:
  * latitude   (latitude) float64 -10.0 -10.05 -10.1 ... -43.9 -43.95 -44.0
  * longitude  (longitude) float64 112.0 112.0 112.1 112.2 ... 153.9 153.9 154.0
Data variables:
    variable1     (latitude, longitude) float32 ...

У меня есть объект time DataArray с координатами от 2017-01-01 до 2017-13-31.

>>>times = pd.date_range("2017/01/01","2018/01/01",freq='D',closed='left')
>>>time_da = xr.DataArray(times, [('time', times)])
>>>time_da
<xarray.DataArray (time: 365)>
array(['2017-01-01T00:00:00.000000000', '2017-01-02T00:00:00.000000000',
       '2017-01-03T00:00:00.000000000', ..., '2017-12-29T00:00:00.000000000',
       '2017-12-30T00:00:00.000000000', '2017-12-31T00:00:00.000000000'],
      dtype='datetime64[ns]')
Coordinates:
  * time     (time) datetime64[ns] 2017-01-01 2017-01-02 ... 2017-12-31

Я хотел бы добавить новое измерение под названием time и назначить ему координаты из time_da, чтобы новый набор данных ds2 выглядел так:

>>>ds2
<xarray.Dataset>
Dimensions:    (latitude: 681, longitude: 841, time: 365)
Coordinates:
  * longitude  (longitude) float64 112.0 112.0 112.1 112.2 ... 153.9 153.9 154.0
  * latitude   (latitude) float64 -10.0 -10.05 -10.1 ... -43.9 -43.95 -44.0
  * time       (time) datetime64[ns] 2017-01-01 2017-01-02 ... 2017-12-31
Data variables:
    sm_pct     (time, latitude, longitude) float32 nan nan nan ... nan nan nan

Это означает исходный массив DataArray [широта, долгота] будет продублирован 365 раз за весь период времени в измерении time.

Я попытался использовать ds.expand_dims, чтобы создать измерение time и назначить time_da к нему, но это не сработало. Ошибка была:

>>> ds2 = ds.expand_dims(dim='time', axis=0)
>>> ds2.coords['time'] = ('time',time_da)
ValueError: conflicting sizes for dimension 'time': length 1 on <this-array> and length 730 on 'time'

1 Ответ

0 голосов
/ 12 июля 2020

Существует подходящее использование expand_dims для вас:

>>> dst = ds.expand_dims(time=time_da)
>>> dst
<xarray.Dataset>
Dimensions:    (latitude: 681, longitude: 841, time: 365)
Coordinates:
  * time       (time) datetime64[ns] 2017-01-01 2017-01-02 ... 2017-12-31
  * latitude   (latitude) int64 0 1 2 3 4 5 6 7 ... 674 675 676 677 678 679 680
  * longitude  (longitude) int64 0 1 2 3 4 5 6 7 ... 834 835 836 837 838 839 840
Data variables:
    variable   (time, latitude, longitude) float64 0.03968 2.156 ... -1.752

Проверка того, что variable одинаково на каждом временном шаге:

>>> np.all(np.diff(dst["variable"], axis=0) == 0)
True
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...