У меня есть фрейм данных с двумя столбцами, days
, указывающий количество дней, в течение которых пользователь был просмотрен, и users
, подсчитывающие количество пользователей, увиденных за это много дней.
+----+---------------+
|days|number_of_users|
+----+---------------+
| 2| 3922|
| 3| 1750|
| 4| 883|
| 5| 563|
| 6| 319|
| 7| 157|
| 8| 79|
| 9| 31|
| 10| 9|
| 11| 2|
+----+---------------+
Пользователи, просмотренные в течение 2 дней (здесь 3922), не видны для 3,4 и т. Д. Таким образом, каждая группа содержит уникальный набор пользователей.Как я могу рассчитать среднее присутствие пользователя на этом кадре данных?
Я думаю о чем-то вроде взятия sum_i[users(i)*days(i)] / 30
, где 30 - это общее количество дней в месяце.Однако я не уверен, как я могу это сделать, или это правильная формула.
РЕДАКТИРОВАТЬ: СРЕДНЕЕ ПРЕДСТАВЛЕНИЕ ПОЛЬЗОВАТЕЛЯ относится к среднему количеству дней, которое пользователь видит, например, из приведенной выше таблицы, например, 3,5 дня.