У меня есть набор данных приблизительно из 1300 строк, который отслеживает количество ежемесячных входов в систему за месяц регистрации пользователя, каждый месяц, и я пытаюсь построить диаграмму с накоплением областей, где каждая серия / трасса является месяцем регистрации пользователя.
Набор данных выглядит следующим образом:
------------------------------------------------------------------------------
user signup month | login month | monthly login count | cumulative login count
------------------------------------------------------------------------------
2016-01 | 2016-01 | 50 | 50
2016-01 | 2016-02 | 25 | 75
2016-01 | 2016-03 | 15 | 90
...
2019-05 | 2019-05 | 1000 | 1000
2019-05 | 2019-06 | 500 | 1500
------------------------------------------------------------------------------
Проблема заключается в том, что когда я пытаюсь отобразить его в своем ноутбуке Python, используя
x=data['login_month']
y=data['cumulative_login_count']
plt.figure(figsize=(20,10))
plt.stackplot(x,y, labels=['user_signup_month'])
plt.legend(loc='upper left')
plt.show()
, он отображается какодна серия, а не одна серия за отдельный месяц регистрации пользователя по желанию.
пример ожидаемого результата:
Примеры, которые я набрал в Google, все вручную вводятся в данные серии, дляпример:
data={'A': [-378, -2347, 509, 987, 513],
'B': [-527, -2599, 765, 533, 670],
'C': [-2343, -2273, 2093, 2197, 1990],
'D': [-1845, -1853, 3325, 1306, 2160]}
, что для меня непрактично и неустойчиво.
Я также довольно новичок в визуализации Python, поэтому я не совсем уверен, какие поисковые термины наиболее эффективны, но я обнаружил, что результаты "составной таблицы трассировок множественных рядов python matlibplot" ссылаются только на вышеуказанное решение с введенными вручную данными ряда