Как создать переменную агрегатную функцию на основе результатов боксплота (сложная) - PullRequest
0 голосов
/ 24 сентября 2019

У меня есть такой фрейм данных:

df=
userid, score, date
1,      0.5,   Jan-19
1,      0.2,   Feb-19
1,      0.3,   March-19
2,      0.1,   Jan-19
2,      0.7,   Feb-19
3,      0.4,   Jan-19

Теперь я хочу создать диаграмму коробочного графика, где на оси X у меня есть дата (название месяца), а на оси Y -результат.Код, который у меня сейчас есть, такой:

ax = sns.boxplot(x="date", y="score", data=df)
plt.show()

enter image description here

Теперь мне нужно выяснить 2 меры:
1. Сколько уникальных пользователей были «топ-пользователями» (75% квартилей и выше) в течение N последующих месяцев, т.е. 40 уникальных пользователей были топ-пользователями в 2 последующих месяцах, где 2 - это переменная.

2. Сколько уникальных пользователей были «топ-пользователями» (75% квартилей и выше) в случайный месяц (ы), то есть 50 уникальных пользователей были топ-пользователями в 4 случайных месяцах, где 4 - это переменная.

Как можноЯ делаю это, и какой тип визуализации рекомендуется?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...