Извлечение процента выборки из большого набора данных для анализа - PullRequest
0 голосов
/ 02 июля 2019

У меня очень большой набор данных в файле NetCDF.

RZSC = xr.open_dataset('/home/chandra/data/RZSC_250m_SA.nc')
RZSC = RZSC.Band1
RZSC
[Output]:
<xarray.DataArray 'Band1' (lat: 32093, lon: 20818)>
[668112074 values with dtype=float32]
Coordinates:
  * lat      (lat) float64 -58.36 -58.36 -58.35 -58.35 ... 13.71 13.71 13.71
  * lon      (lon) float64 -81.38 -81.37 -81.37 -81.37 ... -34.63 -34.63 -34.62
Attributes:
    long_name:     GDAL Band Number 1
    grid_mapping:  crs

Я хочу извлечь процент выборок (например, 5% от всего набора данных) в качестве представителя всего набора данных.Я все еще хочу сохранить координаты (лат. И длин.) Выборки, чтобы я мог извлечь значения из другого набора данных на основе объема моего анализа.У кого-нибудь есть какой-либо способ / предложение для этого?

В настоящее время я даже не могу визуализировать набор данных или выполнить какой-либо анализ по этому вопросу.Я не смог поделиться данными, так как размер файла netcdf составляет> 6 ГБ.

...