У меня есть временной ряд, который будет иметь более 10000 ежедневных значений переменной в течение года, размер массива (365, 10000). Поскольку у меня будет так много данных (много временных рядов для многих переменных), я надеялся сохранить только процентили (0, 10, 20, ..., 90, 100) и использовать их позже на графиках для установки цветового градиента. показывает плотность значений (очевидно, что они самые темные в медиане и самые светлые в минимальных и максимальных значениях). Цель этого состоит в том, чтобы избежать чрезмерных размеров файлов в сохраненных выходных данных моделирования, поскольку у меня будет миллионы выходных данных для обработки. Это значительно уменьшит размеры файла, если я смогу заставить его работать.
Мне удалось вычислить процентили образца набора данных (на данный момент мы используем только 50 значений) и построить их, как показано на прилагаемом рисунке (используя массив размером 365,11). Как бы я использовал эту информацию, чтобы затем настроить график, показывающий градиент цвета (или плотность значений)? Это возможно? Или есть другой способ? Я использую matplotlib ...
import numpy as np
import matplotlib.pyplot as plt
SampleData=(375-367)*np.random.random_sample((365, 50))+367
SDist=np.zeros((365,11))
for i in range(11):
for t in range(365):
SDist[t,i]=np.percentile(SampleData[t,:],i*10)
fig, (ax1) = plt.subplots(nrows=1, ncols=1, sharex=True, figsize=(8,4))
ax1.plot(np.arange(0,365,1), SDist)
ax1.set_title("SampleData", fontsize=15)
ax1.tick_params(labelsize=11.5)
ax1.set_xlabel('Day', fontsize=14)
ax1.set_ylabel('SampleData', fontsize=14)
fig.tight_layout()

РЕДАКТИРОВАТЬ
Вот хороший пример того, к чему я стремлюсь (хотя, очевидно, это будет выглядеть иначе с моими примерами данных) - я думаю, что это похоже на диаграмму поклонников:
