График ECDF без загрузки всех данных в память - PullRequest
0 голосов
/ 27 октября 2018

Мне нужно построить ECDF некоторых данных. Я узнал, что могу сделать это с

ecdf = sm.distributions.ECDF(sample) 
x = np.linspace(min(sample), max(sample))
y = ecdf(x)
plt.step(x, y)

с использованием пакетов matplotlib и statsmodels Python.

Моя проблема в том, что переменная sample содержит около 1 ГБ данных, которые я не могу загрузить в память сразу.

Как я могу построить ECDF при загрузке данных небольшими кусочками?

...