У меня есть объект набора данных (импортированный из файла netCDF через xarray.open_dataset
) с именем ds
. Он содержит переменные с именами variable1
и latitude
и longitude
.
>>>ds
<xarray.Dataset>
Dimensions: (latitude: 681, longitude: 841)
Coordinates:
* latitude (latitude) float64 -10.0 -10.05 -10.1 ... -43.9 -43.95 -44.0
* longitude (longitude) float64 112.0 112.0 112.1 112.2 ... 153.9 153.9 154.0
Data variables:
variable1 (latitude, longitude) float32 ...
У меня есть объект time
DataArray с координатами от 2017-01-01
до 2017-13-31
.
>>>times = pd.date_range("2017/01/01","2018/01/01",freq='D',closed='left')
>>>time_da = xr.DataArray(times, [('time', times)])
>>>time_da
<xarray.DataArray (time: 365)>
array(['2017-01-01T00:00:00.000000000', '2017-01-02T00:00:00.000000000',
'2017-01-03T00:00:00.000000000', ..., '2017-12-29T00:00:00.000000000',
'2017-12-30T00:00:00.000000000', '2017-12-31T00:00:00.000000000'],
dtype='datetime64[ns]')
Coordinates:
* time (time) datetime64[ns] 2017-01-01 2017-01-02 ... 2017-12-31
Я хотел бы добавить новое измерение под названием time
и назначить ему координаты из time_da
, чтобы новый набор данных ds2
выглядел так:
>>>ds2
<xarray.Dataset>
Dimensions: (latitude: 681, longitude: 841, time: 365)
Coordinates:
* longitude (longitude) float64 112.0 112.0 112.1 112.2 ... 153.9 153.9 154.0
* latitude (latitude) float64 -10.0 -10.05 -10.1 ... -43.9 -43.95 -44.0
* time (time) datetime64[ns] 2017-01-01 2017-01-02 ... 2017-12-31
Data variables:
sm_pct (time, latitude, longitude) float32 nan nan nan ... nan nan nan
Это означает исходный массив DataArray [широта, долгота] будет продублирован 365 раз за весь период времени в измерении time
.
Я попытался использовать ds.expand_dims
, чтобы создать измерение time
и назначить time_da
к нему, но это не сработало. Ошибка была:
>>> ds2 = ds.expand_dims(dim='time', axis=0)
>>> ds2.coords['time'] = ('time',time_da)
ValueError: conflicting sizes for dimension 'time': length 1 on <this-array> and length 730 on 'time'