У меня есть такой фрейм данных:
df=
userid, score, date
1, 0.5, Jan-19
1, 0.2, Feb-19
1, 0.3, March-19
2, 0.1, Jan-19
2, 0.7, Feb-19
3, 0.4, Jan-19
Теперь я хочу создать диаграмму коробочного графика, где на оси X у меня есть дата (название месяца), а на оси Y -результат.Код, который у меня сейчас есть, такой:
ax = sns.boxplot(x="date", y="score", data=df)
plt.show()
![enter image description here](https://i.stack.imgur.com/Z45qS.gif)
Теперь мне нужно выяснить 2 меры:
1. Сколько уникальных пользователей были «топ-пользователями» (75% квартилей и выше) в течение N последующих месяцев, т.е. 40 уникальных пользователей были топ-пользователями в 2 последующих месяцах, где 2 - это переменная.
2. Сколько уникальных пользователей были «топ-пользователями» (75% квартилей и выше) в случайный месяц (ы), то есть 50 уникальных пользователей были топ-пользователями в 4 случайных месяцах, где 4 - это переменная.
Как можноЯ делаю это, и какой тип визуализации рекомендуется?