Как построить несколько объектов xarray DataArray на одной фигуре, используя возможность построения xarray? - PullRequest
0 голосов
/ 10 апреля 2019

У меня есть следующий набор данных xarray с 3 измерениями (time, latitude, longitude) и 2 переменными (__xarray_dataarray_variable__, regions).Переменная regions может быть либо nan, 0, 1, 2, 3, 4 или 5, указывая на область Id для широты / долготы.Переменная __xarray_dataarray_variable__ имеет целое число.

<xarray.Dataset>
Dimensions:                        (latitude: 106, longitude: 193, time: 92)
Coordinates:
  * latitude                       (latitude) float32 -39.2 -39.149525 ... -33.9
  * longitude                      (longitude) float32 140.8 140.84792 ... 150.0
  * time                           (time) datetime64[ns] 1972-01-01 ... 2017-07-01
Data variables:
    __xarray_dataarray_variable__  (time, latitude, longitude) int32 dask.array<shape=(92, 106, 193), chunksize=(2, 106, 193)>
    regions                        (latitude, longitude) float64 nan nan ... nan

Я хотел бы построить фигуру, которая содержит 6 строк и где ось Y - это среднее пространственное значение __xarray_dataarray_variable__, а ось X - time,Каждая строка предназначена для одного региона. Идентификатор

da = ds["__xarray_dataarray_variable__"]

# Region 0
da_region_0 = da.where(ds.regions == 0)
da_region_0_mean = da_region.mean(['longitude', 'latitude'])  # Get spatial mean

# We can follow the example to get da for region 1 - region 5.
... ...
p_mean = da_region_0_mean.plot.line(x='time')  # This is only plotting a figure for each region but not all 6 regions.

Как можно построить одну фигуру, которая содержит линии для всех 6 регионов, а не отдельные фигуры для каждого, используя возможность построения графика xarray?

1 Ответ

0 голосов
/ 20 апреля 2019

Мне кажется, я понимаю, что вы ищете. Это способ, которым я бы подошел к этому. Сначала я настрою некоторые данные в вашем стиле:

import matplotlib.pyplot as plt
import numpy as np
import xarray as xr

data = np.random.random((6, 3, 11))
da = xr.DataArray(data, dims=['longitude', 'latitude', 'time'], name='foo')

region_data = np.random.choice(range(6), size=(6, 3))
region = xr.DataArray(region_data, dims=['longitude', 'latitude'], name='region')

ds = xr.merge([da, region])

Этот набор данных, ds, выглядит следующим образом:

<xarray.Dataset>
Dimensions:  (latitude: 3, longitude: 6, time: 11)
Dimensions without coordinates: latitude, longitude, time
Data variables:
    foo      (longitude, latitude, time) float64 0.7016 0.1519 ... 0.1446 0.2396
    region   (longitude, latitude) int64 5 1 1 5 0 1 0 0 2 3 0 4 4 3 3 1 2 1

Чтобы вычислить средние значения по регионам, мы можем сначала собрать значения долготы и широты набора данных:

stacked = ds.stack(xy=('longitude', 'latitude'))

Это позволит нам легко использовать groupby для группировки по номеру региона при вычислении среднего значения:

regional_means = stacked.foo.groupby(stacked.region).mean('xy')

Для построения графика мы можем использовать xarray.DataArray.plot.line вместе с аргументом ключевого слова hue, чтобы создать одну панель со строками временных рядов для каждого региона:

lines = regional_means.plot.line(hue='region', add_legend=False)
labels = range(6)
plt.legend(lines, labels, ncol=2, loc='lower right')

Здесь мы решили создать нашу собственную легенду, чтобы дать нам как можно больше контроля над ее положением и форматом. Это дает сюжет, как это:

Multi-line plot

Больше примеров построения линий можно найти здесь .

...