Question

У меня есть набор данных с одной линией на счет на игрока за игру. Игрок может играть несколько раз в день в нескольких играх.

Мне нужно вычислить среднее количество очков в день на игрока за игру и среднее количество очков всех игроков в день за игру. У меня при этом есть следующее, что на данный момент работает нормально.

team_score=df.groupby(['Team','Game']).resample('D', on='date').mean().ffill().reset_index()

Теперь каждый игрок может войти в игру в любой момент и покинуть игру в любой момент. Мне нужно, чтобы у всех игроков была ценность для каждой даты игры. Благодаря .resample () у меня есть значение даты для каждого дня, когда они играли. Я хотел бы иметь значение даты для каждого дня игры.
В наборе данных есть столбцы для start_date и end_date. Я играю по поводу следующего, но безуспешно

start= df.groupby(['Team', 'Event']).agg({'date': [np.min]})
end= df.groupby(['Team', 'Event']).agg({'date': [np.max]})
index=(start, end)

Я также думаю о том, чтобы смотреть на мультииндекс вместо ресэмпла. Вы все еще можете ffill() при использовании мультииндексирования?

Как использовать более раннюю дату в groupby (). Resample ()?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как использовать более раннюю дату в groupby (). Resample ()?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов