Мне нужно построить ECDF некоторых данных. Я узнал, что могу сделать это с
ecdf = sm.distributions.ECDF(sample)
x = np.linspace(min(sample), max(sample))
y = ecdf(x)
plt.step(x, y)
с использованием пакетов matplotlib
и statsmodels
Python.
Моя проблема в том, что переменная sample
содержит около 1 ГБ данных, которые я не могу загрузить в память сразу.
Как я могу построить ECDF при загрузке данных небольшими кусочками?